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《数据 结构 、 算 法 与 应 用 一 一 C++ 语 言 描述 》 是 享有 盛誉 的 数据 结构 教科 书 的 第 2 版 。 它 完整 地 包含 了 基本 
数据 结构 的 内 容 - 是 CS2 课 程 的 理想 用 书 a- 作 者 SartajSahini 通 过 循循善诱 的 讲解 -直观 上 其 体 的 讨论 和 基于 现实 
的 应 用 ， 让 读者 轻松 、 答 快 地 学 习 。 新 版 书 着 重 利用 标准 模板 库 (STL),， 把 书 中 开发 的 数据 结构 和 算法 与 相应 的 
STL 实 现 方法 相互 关联 。 本 书 还 增加 了 很 多 新 的 实例 和 练习 题 。 

书 中 的 应 用 实例 是 它 的 特色 。Sahni 博 士 为 每 一 个 数据 结构 和 算法 都 提供 了 若干 个 应 用 实例 ， 涉 及 排序 、 
压缩 编码 和 图 像 处 理 等 多 个 方面 。 这 些 实例 把 概念 和 应 用 结合 在 一 起 ， 使 理论 与 实践 统一 ， 从 而 让 概念 容易 理 
解 ， 使 学 生 增加 学 习 动 力 和 兴趣 。 

未 书 采 用 的 实用 教学 方法 ， 不仅 充 实 了 理论 概念 ， 而 且 大 量 的 习题 让 学 生 有 了 实践 机 会 ( 书 中 有 800 多 道 练 
习题 .包括 理解 题 和 简单 的 编程 题 和 工程 设计 题记 5 除 此 之 外 ;本 书 的 配套 网 站 土 包含 书 中 的 所 有 程序 < 示例 
数据 、 运 行 结果 、 部 分 练习 的 解答 和 带 有 结果 的 示例 测试 。 
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结构 。 第 三 部 分 从 第 17 章 到 第 21 章 ， 研 究 常用 算法 ， 包 括 贪 焚 算法 、 分 而 治之 算法 、 动 态 规划 、 回 淹 
算法 和 分 支 定 界 算法 。 

本 书 内 容 广博 、 组 织 合理 、 论 述 清晰 、 循 序 渐进 ， 每 章 包 含 丰富 的 习题 ， 对 程序 性 能 的 分 析 和 测量 
系统 且 细 致 ， 不 仅 是 数据 结构 和 算法 的 经 典 教材 ， 而 且 是 计算 机 科学 与 工程 领域 的 理想 参考 书 。 

















出 版 发 行 : 机 械 工业 出 版 社 (北京 市 西城 区 百 万 庄 大 街 22 号 ”邮政 编码 : 100037 ) 








责任 编辑 : 朱 秀 英 责任 校对 : 有 丙 虹 

印 刷 : 北京 诚信 伟业 印刷 有 限 公 司 版 次 : 2015 年 4 月 第 1 版 第 1 次 印刷 
开 ”本 : 185mmx260mm 1/16 印 张 : 35 

书 “号 : ISBN 978-7-111-49600-7 定 价 : 79.00 元 





凡 购 本 书 ， 如 有 缺 页 、 倒 页 、 脱 页 ， 由 本 社 发 行 部 调换 
客服 热线 : (010 ) 88378991 88361066 投稿 热线 : (010 ) 88379604 
购书 热线 ; (010 ) 68326294 88379649 68995259 读者 信箱 : hzjsj@hzbook,com 


版 权 所 有 “ 侵权 必 究 
封底 无 防伪 标 均 为 盗版 
本 书法 律 顾问 北京 大 成 律师 事务 所 韩 光 / 邹 晓 东 


| 出 版 者 的 话 


Data Structures, Algorithms, and Applications in C++, Second Edition 


文艺 复兴 以 来 ， 源远流长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信 息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ;而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教 材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 条 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill，Elsevier，MIT，John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S.Tanenbaum ，Bjarne Stroustrup， 
Brain W.Kernighan, Dennis Ritchie, Jim Gray, Afred V.Aho, John E.Hopcroft, Jeffrey D.Ullman ， 
Abraham Silberschatz, William Stallings, Donald E.Knuth, John L.Hennessy, Larry 工 .Peterson 
等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 
大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 
百 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 深 
化 ,教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 
联系 电话 : ( 010 ) 88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 

邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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数据 结构 和 算法 是 计算 机 科学 和 工程 的 基础 。 它 们 的 相互 联系 和 作用 是 程序 的 本 质 ， 
Nicklaus Wirth 把 它们 表示 为 : 算法 + 数据 结构 = 程序 。Sartaj Sahni 博士 的 《数据 结构 、 算 法 
与 应 用 一 一 C++ 语言 描述 》 一 书 是 彰显 这 一 本 质 的 当代 经 典 ， 这 主要 表现 在 五 个 方面 : 

1 ) 每 一 种 数据 结构 和 算法 设计 不 仅 都 用 C++ 语言 优美 地 实现 了 ， 而 且 与 C++ 标准 模板 
库 所 使 用 的 结构 在 相似 性 或 同一 性 上 保持 兼容 ， 既 纯粹 又 规范 。 

2 ) 对 程序 性 能 的 分 析 和 测量 系统 而 严谨 ， 既 有 严格 的 数学 分 析 ， 又 有 周密 的 实验 测量 。 

3 ) 几乎 每 一 种 数据 结构 和 算法 都 是 从 多 个 应 用 实例 中 分 析 和 抽象 出 来 的 ， 既 可 以 拓宽 应 
用 领域 知识 ， 又 可 以 提高 学 习 兴 趣 。 

4 ) 一 个 典型 的 应 用 实例 常常 用 多 种 数据 结构 和 算法 来 实现 ， 既 丰富 了 程序 设计 经 验 ， 又 
在 比较 中 提高 了 鉴别 能 力 。 

5 ) 练习 题 丰 富 。 本 书 及 其 网 站 共有 800 多 道 练习 题 ， 而 且 和 教材 正文 中 的 示例 代码 相 辅 
相 成 。 这 些 练习 题 趣味 多 样 且 难 易 相 济 ， 可 满足 各 层次 读者 的 需求 。 

如 果 你 是 一 名 程序 设计 新 手 ， 本 书 是 你 拾级 而 上 的 阶梯 ; 如 果 你 是 一 名 专业 程序 设计 者 ， 
本 书 是 你 高 屋 建 领 的 楼 台 ; 如 果 你 是 在 校 大 学 生 ， 本 书 是 你 学 习 数据 结构 和 算法 的 理想 教材 
或 参考 书 。 

对 中 国学 生来 说 ， 本 书 的 意义 还 可 以 从 更 高 的 层次 来 认识 。 爱 因 斯 坦 认为 ， 西 方 科学 的 
发 展 是 以 两 个 伟大 的 成 就 为 基础 的 : 形式 逻辑 体系 和 实验 体系 。 今 天 的 计算 机 科学 不 仅 是 这 
两 个 成 就 的 综合 体现 ， 而 且 深 入 社会 的 每 个 角落 ， 时 刻 改 变 着 我 们 的 生活 ， 使 每 一 个 人 时 刻 
感受 到 它 的 力量 。 数 据 结 构 和 算法 作为 计算 机 科学 和 工程 的 核心 ， 可 以 使 更 多 的 中 国学 子 通 
过 这 门 课程 而 更 积极 、 更 有 效 地 掌握 形式 逻辑 和 实验 方法 。 但 是 长 期 以 来 ， 我 国 的 教材 大 都 
使 用 伪 码 来 描述 数据 结构 和 算法 ， 给 教学 和 自学 带 来 极 大 的 困难 。 因 为 代码 不 落实 ， 实 验 测 
量 就 无 法 进行 ; 没有 实验 测量 ， 单 赁 分 析 就 没有 可 靠 的 结果 ( 例如 高 速 缓冲 存储 器 对 运行 时 
间 的 影响 是 不 能 只 靠 分 析 得 到 的 ); 分 析 没 有 结果 ， 就 容易 流 于 形式 ， 以 至 于 理论 和 实践 脱节 ， 
成 为 概念 的 灌输 。 这 正 是 Stroustrup 在 《C++ 程序 设计 原理 与 实践 》 一 书 的 前 言 中 所 批评 的 
学 习 模 式 : 先 学 习 一 个 月 的 理论 知识 ， 然 后 看 看 是 否 能 使 用 这 些 理论 。 

Sartaj Sahni 博士 的 力作 如 阳光 和 雨露 照 盗 和 滋养 我 们 ， 它 从 五 个 方面 引导 我 们 走 上 精神 
探险 的 旅程 ， 饱 览 西方 科学 成 就 中 美丽 璀璨 的 风景 ， 尽 情 品尝 科学 智 丰 中 一 种 鲜美 甘甜 的 果 
实 : 数据 结构 与 算法 。 





王立 柱 
2014 年 10 月 于 天 津 
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| 前 言 


Data Structures, Algorithms, and Applications in C++, Second Edition 


对 数据 结构 和 算法 的 研究 是 计算 机 科学 和 工程 的 基础 。 精 通 这 方面 的 知识 ， 对 开发 能 够 有 
效 利 用 计算 机 资源 的 程序 是 必 不 可 少 的 。 因此， 所 有 计算 机 科学 和 工程 专业 都 有 一 门 或 几 门 课 
程 专门 用 来 讲授 这 方面 的 内 容 。 一 般 来 说 ， 第 一 门 程序 设计 课程 介绍 数据 结构 和 算法 的 基础 知 
识 (数据 结构 的 栈 和 队列 ， 算 法 的 排序 和 和 矩阵 运算 )。 第 二 门 程序 设计 课程 介绍 数据 结构 和 算法 
的 系统 知识 。 随 后 ， 可 以 对 数据 结构 和 算法 进行 深入 的 研究 ， 这 通常 需要 一 门 或 两 门 课程 。 

计算 机 科学 和 工程 的 本 科 专 业 课 程 过 多 , 已 经 迫使 很 多 高 等 院 校 进行 课程 整合 。 例 如 ， 
在 佛罗里达 大 学 ， 给 本 科 生 只 开设 一 学 期 的 数据 结构 和 算法 的 课程 。 在 学 习 本 课程 之 前 ， 要 
求学 生 已 经 学 过 一 学 期 的 Java 程序 设计 和 离散 数学 。 

本 书 既 可 以 用 于 两 门 或 更 多 的 专门 研究 数据 结构 和 算法 的 课程 ， 也 可 以 用 于 相关 的 一 门 
综合 课程 。 全 书 共 分 三 个 部 分 。 第 一 部 分 从 第 1 章 到 第 4 章 ， 旨 在 复习 C++ 程序 设计 的 概念 
以 及 程序 性 能 的 分 析 和 测量 方法 。 对 于 熟悉 C 语言 程序 设计 的 学 生 ， 通 过 学 习 第 1 章 应 该 能 
够 过 渡 到 C++。 第 1 章 虽 然 不 是 C++ 的 人 门 知 识 ， 但 是 依然 包含 了 C++ 的 一 些 基 本 概念 ， 这 
些 概念 常 令 学 生 感 到 困惑 ， 如 参数 传递 、 模 板 函 数 、 动 态 存储 分 配 、 递 归 、 类 、 继 承 、 异 常 
的 抛 出 和 捕捉 。 第 2 章 和 第 3 章 复 习 了 程序 性 能 的 分 析 和 测量 方法 一 一 操作 计数 、 执 行 步 数 
和 渐 近 符号 (大 0、2、@9, 小 o), 第 4 章 复习 了 程序 性 能 的 实验 测量 方法 ， 还 简要 地 讨论 了 
高 速 缓冲 存储 器 对 运行 时 间 测 量 的 影响 问题 。 第 2 章 通过 程序 性 能 分 析 方 法 的 应 用 ， 深 入 研 
究 了 在 程序 设计 入 门 课程 中 遇 到 的 典型 的 基础 性 算法 : 简单 的 排序 算法 ( 冒 泡 排序 、 选 择 排 
序 、 插 入 排序 和 计数 排序 )， 顺 序 搜索 ， 利 用 Horner 法 则 进行 多 项 式 求 值 ， 和 矩阵 运算 ( 和 矩 阵 
相 加 、 和 矩阵 转 回 、 和 矩阵 相 乘 )。 第 3 章 研究 了 二 分 搜索 算法 。 尽 管 第 2 章 到 第 4 章 的 主要 目的 
是 学 习 程 序 性 能 的 分 析 和 测量 方法 ， 但 是 也 让 学 生 精 通 了 一 组 基本 算法 。 

本 书 第 二 部 分 从 第 5 章 到 第 16 章 ， 深 入 研究 了 数据 结构 。 第 $ 章 和 第 6 章 分 别 研究 了 
数据 的 数组 描述 方法 和 指针 ( 或 链 式 ) 描述 方法 ,构建 起 数据 结构 研究 的 框架 。 这 两 章 用 这 
两 种 数据 描述 方法 来 创建 C++ 类 ， 以 描述 线性 表 数 据 结构 。 我 们 通过 实验 数据 对 不 同 的 数据 
描述 方法 在 描述 线性 表 时 的 性 能 进行 了 比较 。 第 二 部 分 从 第 7 章 以 后 都 是 应 用 第 5 章 和 第 6 
章 的 描述 方法 来 描述 其 他 的 数据 结构 ， 如 数组 和 和 矩阵 (第 7 章 )、 栈 (第 8 章 )、 队 列 (第 9 
章 )、 字 典 (第 10、14 和 15 章 )、 二 又 树 (第 11 章 )、 优 先 级 队列 (第 12 章 )、 竞 赛 树 (第 
15 章 ) 和 图 (第 16 章 )。 

本 书 在 处 理 数 据 结构 时 ， 试 图 做 到 与 C++ 标准 模 板 库 ( STL ) 所 使 用 的 结构 在 相似 性 或 
同一 性 上 保持 兼容 。 例 如 ,第 5 章 的 线性 表 数 据 结 构 便 是 按照 STL 的 类 vector 的 模式 而 建立 
的 。 本 书 通 篇 都 利用 了 STL 的 函数 ， 诸 如 copy 、min 和 max ， 学 生 由 此 会 熟悉 这 些 函 数 。 

本 书 第 三 部 分 从 第 17 章 到 第 21 章 “, 研究 常用 的 算法 设计 方法 。 这 些 方法 有 贪 焚 算 法 (第 
17 章 )、 分 而 治之 算法 (第 18 章 )、 动 态 规划 (第 19 章 )、 回 溯 算 法 (第 20 章 ) 和 分 支 定 界 
算法 (第 21 章 )。 另 外 还 包括 两 种 下 限 的 证 明 ( 最 小 最 大 问题 和 排序 问题 ) ( 18.4 节 )、 机 器 
调度 的 近似 算法 ( 12.6.2 节 )、 箱 子 装 载 算法 (13.5 节 ) 和 0/1 背包 问题 (17.3.2 节 )。12.6.2 


@ 第 20 和 21 章 发 布 在 原 书 网 站 上 ， 中 译 版 书包 含 第 20 和 21 章 。 一 编辑 注 
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节 还 简略 地 介绍 了 NP- 复杂 问题 。 

本 书 的 一 个 特色 是 强调 应 用 。 书 中 的 每 一 种 数据 结构 和 算法 设计 都 通过 多 个 应 用 实例 来 
演示 。 通 常 每 一 章 的 最 后 一 节 都 针对 本 章 介绍 的 数据 结构 或 设计 方法 给 出 具体 的 应 用 。 很 多 
时 候 ， 在 一 章 的 前 面 几 节 也 包含 一 些 应 用 实例 。 这 些 应 用 实例 涉及 多 个 方面 一 一 排序 ( 冒 泡 
排序 、 选 择 排序 、 插 入 排序 、 计 数 排序 、 堆 排序 、 归 并 排序 、 快 速 排序 、 箱 子 排序 、 基 数 排 
序 和 拓扑 排序 ) ; 矩阵 运算 ( 矩阵 加 法 、 和 矩阵 转 置 、 和 矩阵 乘法 ) ; 电路 设计 自动 化 (搜索 电路 
网 组 、 电 路 布线 、 元 件 折 倒 、 开 关 盒 布线 、 设 置信 号 放大 器 、 交 叉 分 布 、 电 路 板 排 列 ); 压缩 
编码 (LZW 压缩 、 霍 夫 曼 编码 ) ; 计算 几何 ( 凸 包 和 最 近 点 对 ) ; 仿真 (工厂 仿真 ) ; 图 像 处 
理 (图 元 标注 ); 趣味 数学 ( 汉 诺 塔 、 残 缺 棋盘 、 迷 宫 老 鼠 ); 调度 (LPT 调度 ); 优化 ( 装 箱 
问题 、 货 箱 装载 、0/1 背包 、 和 矩阵 乘法 链 ) ; 统计 ( 直方 图 、 寻 找 最 大 值 和 最 小 值 、 寻 找 第 
个 最 小 值 ) ; 图 论 (生成 树 、 图 元 、 最 短路 径 、 最 大 完备 子 图 、 二 分 覆盖 和 旅行 商 )。 人 研究 这 
些 应 用 实例 不 需要 学 生 具 有 相关 领域 的 预备 知识 ， 因 为 本 书包 含 了 这 些 知 识 ， 而 且 这 些 知 识 
会 提高 学 生 的 学 习 兴 趣 。 

我 们 希望 通过 把 实际 应 用 与 数据 结构 和 算法 设计 方法 的 基础 研究 紧密 结合 ， 能 够 激发 学 生 更 
大 的 专业 兴趣 。 学 生 通 过 完成 本 书 和 本 书 网 站 的 800 多 道 练 习题 ， 知 识 将 会 更 加 丰富 和 牢固 。 
网 站 

本 书 网 站 的 URL 为 http://www.cise.ufl.edu/~sahni/dsaac。 

访问 该 网 站 可 以 得 到 本 书 的 所 有 程序 以 及 示例 数据 和 输出 结果 。 示 例 数据 并 不 是 特意 设 
计 的 测试 数据 ， 而 是 用 来 运行 程序 以 便 将 输出 结果 与 给 定 的 输出 结果 进行 比较 的 数据 。 网 站 
还 有 每 一 章 的 练习 答案 、 一 些 测 试 样本 以 及 相应 的 测试 结果 、 补 充 的 应 用 实例 和 对 书 中 一 部 
分 内 容 的 进一步 讨论 。 


如 何 使 用 本 书 
使 用 本 书 讲授 数据 结构 和 算法 可 以 采用 多 种 课程 安排 ， 这 需要 教师 根据 学 生 的 知识 背景 、 
对 应 用 的 侧重 程度 和 课时 的 多 少 来 决定 。 下 面 是 几 种 可 能 的 课程 安排 方案 。 我 们 建议 学 生 的 
作业 是 编写 和 调试 一 些 程序 ， 开 始 是 一 些小 程序 ， 随 着 课程 的 深入 ， 程 序 逐 渐 复杂 。 学 生 应 
该 根据 课堂 讲授 的 内 容 ， 同 步 阅读 本 书 的 相关 内 容 。 
两 季度 课程 安排 一 一 第 一 季度 
(一 周 回顾 ， 数 据 结构 和 算法 内 容 系列 ) 


周 主题 阅读 
1 回顾 C++ 和 程序 性 能 第 1 ~ 4 章 , 布置 作业 1 

2 基于 数组 的 描述 第 5 章 ， 完 成 作业 1 

3 链表 描述 6.1 ~ 6.4 节 ， 布 置 作业 2 

4 箱子 排序 和 等 价 类 6.5.1 ~ 6.5.4 节 ， 完 成 作业 2 
| 数组 和 矩阵 第 7 章 ， 测 试 

6 栈 和 队列 第 8 章 和 第 9 章 ， 布 置 作 业 3 
了 跳 表 和 散 列 第 10 章 ， 完 成 作业 3 

8 二 叉 树 和 其 他 树 11.1 ~ 11.8 节 ， 布置 作 业 4 
9 并 查 集 应 用 ， 堆 和 堆 排 序 11.9.2 节 、12.1 ~ 12.4 节 和 12.6.1 节 ， 完 成 作业 4 
10 左 高 树 ， 和 替 夫 曼 编码 和 竞赛 树 12.5 节 和 12.6.3 节 ， 第 13 章 
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两 季度 课程 安排 一 一 第 二 季度 
(数据 结构 和 算法 内 容 系列 ) 









































周 主题 阅读 
1 二 又 搜 索 树 ，AVL 或 红 黑 树 ， 直 方 图 第 14 章 和 第 15 章 ， 布 置 作业 1 
2 图 16.1 ~ 16.7 节 ， 完 成 作业 1 
3 图 16.8 节 和 16.9 节 ， 布 置 作业 2 
4 贪 禁 算 法 17.1 ~ 17.3.5 节 ， 完 成 作业 2 
5 贪 禁 算法 和 分 而 治之 算法 17.3.6 节 和 18.1 节 ， 布置 作业 3 
6 分 而 治之 算法 应 用 18.2 节 ， 测 试 
了 求解 递归 式 ， 下 限 和 动态 编程 18.3 节 、18.4 节 和 19.1 节 ， 完 成 作业 3 
8 动态 编程 应 用 19.2.1 节 和 19.2.2 节 ， 布 置 作业 4 
9 动态 编程 应 用 19.2.3 ~ 19.2.5 节 ， 完 成 作业 4 
10 回溯 和 分 支 定 界 算法 第 20 章 和 第 21 章 
一 学 期 课程 安排 
( 两 周 回 顾 ， 数 据 结构 内 容 系列 ) 
周 主题 阅读 
1 回顾 C++ 第 1 章 ， 布置 作 业 1 
2 回顾 程序 性 能 第 2 ~ 4 章 
3 基于 数组 的 描述 第 5 章 ， 完 成 作业 1 
4 链表 描述 6.1 ~ 6.4 节 ， 布 置 作业 2 
5 箱子 排序 和 等 价 类 6.5.1 节 和 6.5.4 节 
6 数组 和 抑 阵 第 7 章 ， 完 成 作业 2， 第 1 次 测试 
7 栈 和 队列 ， 一 或 两 个 应 用 第 8 章 和 第 9 章 ， 布 置 作 业 3 
8 跳 表 和 散 列 第 10 章 
9 二 又 树 和 其 他 树 11.1 ~ 11.8 节 , 完成 作业 3 
10 并 查 集 应 用 11.9.2 节 , 布置 作业 4， 第 2 次 测试 
11 优先 级 队列 、 堆 排序 和 霍 夫 曼 编码 第 12 章 
13 竞赛 树 和 装 箱 问题 第 13 章 ， 完 成 作业 4 
13 二 义 搜 索 树 ，AVL 树 或 红 黑 树 ， 直 方 图 第 14 章 和 第 15 章 ， 布 置 作业 5 
14 图 16.1 ~ 16.7 
15 图 ， 最 短路 径 16.8 节 、16.9 节 、17.3.5 节 和 19.2.3 节 ， 完 成 作业 $ 


16 最 小 生成 树 ， 合 并 排序 和 快速 排序 





17.3.6 节 、18.2.2 节 和 18.2.3 节 


一 学 期 课程 安排 
(一 周 回顾 ， 数 据 结 构 和 算法 内 容 系 列 ) 





阅读 





周 主题 
1 回顾 程序 性 能 

基于 数组 的 描述 

3 链表 描述 

4 数组 和 和 矩阵 

5 栈 和 队列 ， 一 或 两 个 应 用 
6 跳 表 和 散 列 

7 二 义 树 和 其 他 树 


弟 1 -4 章 





第 5 章 ,， 布置 作业 1 

第 6 章 

第 7 章 ， 完 成 作业 1 

第 8 章 和 第 9 章 ， 布 置 作业 2 

第 10 章 ， 完 成 作业 2， 第 1 次 测试 
11.1 ~ 11.8 节 ， 布 置 作业 3 
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周 主题 
8 并 查 集 应 用 ， 堆 和 堆 排序 
9 左 高 树 ， 霍 夫 曼 编码 和 竞赛 树 
10 二 叉 搜 索 树 ，AVL 树 或 红 黑 树 ， 直 方 图 
11 图 
12 图 和 贪 禁 算法 
13 货 箱 装载 ，0/1 背包 ， 最 短路 径 和 生成 树 
14 分 而 治之 算法 
15 动态 编程 
16 回溯 和 分 支 定 界 算法 
致谢 


( 续 ) 
阅读 
11.9.2 节 、12.1 ~ 12.4 节 和 12.6.1 节 
12.5 节 和 12.6.3 节 , 第 13 章 ， 完 成 作业 3 
第 14 章 和 第 15 章 ， 布 置 作 4， 第 2 次 测试 
16.1 ~ 16.7 节 
16.8 节 、16.9 节 、17.1 节 和 17.2 节 ， 完 成 作业 4 
17.3 节 ， 布置 作 业 5 
第 18 章 
第 19 章 ， 完 成 作业 5 
第 20 章 和 第 21 章 
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概述 


大 家 好 ! 我 们 将 要 开始 一 段 旅程 ， 穿 越 “ 数 据 结 构 、 算 法 和 程序 ”的 世界 ， 以 解决 现实 
生活 中 的 许多 难题 。 程 序 开发 过 程 要 求 我 们 做 到 两 点 : 一 是 高 效 的 数据 描述 ; 二 是 步骤 合理 、 
可 用 程序 实现 的 算法 设计 。 要 做 到 第 一 点 ， 必 须 具 备 数据 结构 领域 的 专门 知识 ; 要 做 到 第 二 
点 ， 必 须 具 备 算 法 设计 领域 的 专门 知识 。 

在 开始 研究 数据 结构 和 算法 设计 方法 之 前 ， 你 要 熟练 掌握 编写 C++ 程序 和 分 析 程 序 
es CO OE DO A a ig i 
旨 在 帮助 你 复习 这 些 技能 ， 不 过 有 很 多 内 容 你 可 能 已 经 熟悉 了 。 

第 1 章 我 们 将 讨论 C++ 语言 的 一 些 特性 。 因 为 本 章 不 是 C++ 入门 ， 所 以 没有 介绍 诸如 赋 
值 语句 、if 语 句 和 循环 语句 (如 for 和 while ) 等 基本 结构 。 本 章 要 复习 的 C++ 特性 如 下 : 

e 参数 传递 的 不 同方 式 (如 值 传递 、 引 用 传递 和 常量 引用 传递 )。 

e 了 因 数 或 方法 返回 的 不 同方 式 (如 值 返回 、 引 用 返回 和 和 常量 引用 返回 )。 

e 模板 函数 。 

e 递归 际 数 。 

e 常量 函数 。 

e 内 存 分 配 和 释放 函数 : new 和 delete。 

e 异常 处 理 结构 : try、catch 和 throw。 

e 类 与 模板 类 。 

e 类 的 公有 成 员 、 保 护 成 员 和 私有 成 员 。 

e@ 友 元 。 

e 操作 符 重 载 。 

e 标准 模板 库 。 

本 章 没 有 涉及 的 C++ 特性 将 在 后 续 章节 需要 的 时 候 加 以 介绍 。 本 章 包 含 如 下 应 用 程序 的 
代码 : 

e 动态 分 配 与 释放 一 维和 二 维 数组 。 

e 求解 二 次 方程 。 

e 生成 n 个 元 素 的 所 有 排列 方式 。 

e 寻找 nn 个 元 素 的 最 大 值 。 

此 外 ， 本 章 还 给 出 测试 和 调试 程序 的 一 些 技 巧 。 


1.1 引言 


在 检查 一 个 程序 时 ， 我 们 应 该 问 如 下 几 个 问题 ; 
e 它 正 确 吗 ? 
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它 容 易 读 懂 吗 ? 
它 有 完善 的 文档 吗 ? 
它 容 易 修改 吗 ? 
它 在 运行 时 需要 多 大 内 存 ? 
它 的 运行 时 间 有 多 长 ? 
它 的 通用 性 如 何 ?” 能 否 不 加 修改 就 可 以 解决 更 大 范围 的 数据 ? 
它 可 以 直接 在 多 种 计算 机 上 编译 和 运行 吗 ?或 者 说 它 需 要 修改 之 后 才能 运行 ? 
上 述 一 些 问 题 的 重要 性 是 相对 的 ， 取 决 于 应 用 环境 。 例 如 ， 如 果 我 们 正在 编写 一 个 只 
需 运 行 一 次 即 可 丢弃 的 程序 ， 那 么 主要 考虑 的 问题 应 该 是 程序 是 否 正确 、 对 内 存 和 运行 时 
间 有 什么 要 求 以 及 能 否 在 某 台 计算 机 上 编译 和 运行 。 不 管 具体 的 应 用 环境 是 什么 ,程序 最 
重要 的 特性 是 正确 。 一 个 程序 如 果 是 不 正确 的 ， 那么 不 管 它 运行 得 多 快 、 通 用 性 多 好 、 文 
档 多 完善 ， 都 是 毫 无 意义 的 ( 除非 把 它 修改 正确 )。 尽 管 我 们 无 法 明确 地 详 述 确立 程序 正确 
性 的 技术 ， 但 可 以 提供 一 些 常用 的 验证 程序 正确 性 的 手段 以 及 公认 的 程序 设计 习惯 ， 这 有 
助 于 你 编写 正确 的 代码 。 我 们 的 目标 是 教 你 一 些 技术 ， 用 来 开发 正确 、 精 致 和 高 效 的 程序 。 
在 学 习 这 些 技术 之 前 ,我们 必须 复习 一 些 C++ 语言 的 基本 内 容 、 测 试 和 调试 程序 的 技 
术 、 人 性 能 分 析 和 测量 程序 性 能 的 技术 。 这 一 章 的 重点 是 前 两 个 内 容 ， 第 2 章 到 第 4 章 复习 性 
能 分 析 和 测量 技术 。 


1.2 ”函数 与 参数 
1.2.1 传 值 参 数 


考察 函数 abc ( 见 程序 1-1 )。 该 函数 用 来 计算 表达 式 atb*c, 其 中 a、b 和 c 是 整数 ， 结 果 
也 是 一 个 整数 。 


程序 1-1 计算 一 个 整 型 表达 式 
int abc(int a, int b, int c) 
{ 
retarsjj 会 外 * CF 
} 


在 程序 1-1 中 , a、b 和 c 是 函数 abc 的 形 参 ( formal parameter )， 每 一 个 形 参 都 是 整 型 的 。 
如 果 在 下 面 的 语句 中 调用 函数 abc: 


z = abc(2,x,y) 


那么 ，2、x 和 y 便 是 分 别 与 4a、b 和 c 对 应 的 实 参 ( actual parameter )。 

在 程序 1-1 中 ， 形 参 a、b、c 实际 上 是 传 值 参数 ( value parameter )。 在 运行 时 ， 函 数 abc 
执行 前 ， 把 实 参 复制 给 形 参 。 复 制 过 程 是 由 形 参 类 型 的 复制 构造 函数 ( copy constructor ) 来 
完成 的 。 如 果实 参 和 形 参 的 类 型 不 同 ， 必 须 进 行 类 型 转换 ， 把 实 参 转换 为 形 参 的 类 型 ， 当 然 ， 
前 提 是 这 样 的 类 型 转换 是 允许 的 。 

当 调 用 abc(2,x,y) 时 ，a 被 赋值 2，b 被 赋值 x，c 被 赋值 y。 如 果 x 或 y 不 是 int 类 型 ， 那 
么 在 把 它们 的 值 赋值 给 b 和 c 之前， 首先 要 对 它们 进行 类 型 转换 。 例 如 ， 如 果 x 是 double 类 
型 ， 其 值 为 3.8， 那 么 b 被 赋值 为 3。 


当 函 数 运行 结束 时 ， 形 参 类 型 的 析 构 函数 ( destructor ) 负责 释放 形式 参数 。 当 一 个 函数 
运行 结束 时 ， 形 参 的 值 不 会 被 复制 到 对 应 的 实 参 中 。 因 此 ， 函 数 调用 不 会 修改 与 形 参 对 应 的 
实 参 的 值 。 


1.2.2 ”模板 函数 


假定 我 们 希望 编写 另外 一 个 函数 来 计算 与 程序 1-1 相同 的 表达 式 ， 不 过 这 次 a、b 和 fc 是 
float 类 型 ， 结 果 也 是 float 类 型 。 程 序 1-2 中 给 出 了 具体 的 代码 。 程 序 1-1 和 程序 1-2 的 区 别 
仅 在 于 形 参 以 及 也 数 返回 值 的 类 型 不 同 。 


程序 1-2 计算 一 个 浮 点 型 表达 式 
float abc (float a, float bb, float c) 
{ 
return aa b* ey 


} 


与 其 对 每 一 种 可 能 的 形 参 类 型 都 编写 一 个 相应 函数 的 新 版 本 ， 不 如 编写 一 段 通用 代码 ， 
它 的 参数 类 型 是 一 个 变量 ， 它 的 值 由 编译 器 来 确定 。 这 种 通用 代码 使 用 的 是 模板 语句 ， 如 程 
序 1-3 所 示 。 


程序 1-3 ”利用 模板 函数 计算 一 个 表达 式 


template<class T> 
TT abe{(T a Tb T Ee) 
{ 

return a + bb * /ey 
} 


从 这 段 通用 代码 ， 编 译 器 通过 把 T 蔡 换 为 int 而 构造 出 程序 1-1， 把 T 苦 换 为 float 又 构 
造 出 程序 1.2。 事 实 上 ， 通 过 把 了 替换 为 double 或 long， 编 译 器 还 可 以 构造 出 函数 abc 的 双 
精度 型 版 本 和 长 整 型 版 本 。 把 函数 abc 编写 成 模板 函数 , 我 们 就 不 必 了 解 形 参 的 类 型 了 ， 


1.2.3 引用 参数 


程序 1-3 使 用 的 形 参 会 增加 程序 的 运行 时 间 。 例 如 ， 我 们 来 考察 一 下 函数 被 调用 以 及 返 
回 时 所 涉及 的 操作 。 当 a、b 和 ec 是 传 值 参数 时 ， 一 进入 函数 调用 ， 类 型 T 的 复制 构造 函数 便 
把 相应 的 实 参 分 别 复制 给 形 参 a、b 和 c， 以 供 函 数 使 用 。 当 函数 返回 时 ， 类 型 T 的 析 构 函数 
被 启用 ， 以 释放 形式 参数 a、b 和 的 空间 。 

假定 了 是 用 户 自 定义 数据 类 型 matrix， 那 么 它 的 复制 构造 函数 将 复制 矩阵 matrix 的 所 有 
元 素 ， 而 析 构 函数 则 将 逐个 释放 矩阵 元 素 ( 假定 matrix 已 经 定义 了 操作 符 +、* 和 /), 假设 矩 
阵 matrix 有 1000 个 元 素 , 函数 abc 的 实 参 是 matrix 类 型 ， 当 调用 函数 abc 时 ， 把 三 个 实 参 复 
制 给 形 参 a、b 和 c 需要 3000 次 操作 。 当 函数 abc 结束 时 ，matrix 的 析 构 函数 又 需要 3000 次 
操作 来 释放 a、b 和 ec。 

在 程序 1-4 的 代码 中 , a、b 和 c 是 引用 参数 (reference parameter)。 如 果 用 语句 
abc(x,y,z) 来 调用 函数 abc， 其 中 实 参 x、y 和 z 的 数据 类 型 是 相同 的 ， 那 么 这 些 实 参 分 别 是 a、 
b 和 ec 的 别名 ， 即 在 函数 abc 执行 期 间 ， 名 字 x、y 和 z 分 别 代替 了 名 字 a、b 和 c。 与 传 值 参 


党 1 竟 CH 回顾 5 





数 的 情况 不 同 ， 当 函数 被 调用 时 ， 这 个 程序 没有 复制 实 参 的 值 ， 在 函数 返回 时 ， 也 没有 调用 
析 构 函数 。 


程序 1-4 利用 引用 参数 计算 一 个 表达 式 

template<class T> 

T aBG(TE da TE Br TE& G&G) 

{ 

return a+h* er 

} 

当 a、b 和 c 所 对 应 的 实 参 x、y 和 z 分 别 是 具有 1000 个 元 素 的 矩阵 类 型 时 ， 和 情况 是 怎样 
的 ?因为 不 需要 把 x、y 和 z 的 值 复 制 给 对 应 的 形 参 ， 所 以 节省 了 传 值 参数 在 参数 复制 时 所 需 
要 的 3000 次 操作 。 


1.2.4 常量 引用 参数 


C++ 还 提供 了 另外 一 种 参数 传递 模式 一 一 常量 引用 (const reference )。 这 种 模式 指明 的 
引用 参数 不 能 被 函数 修改 。 例 如 ， 在 程序 1-4 中 ，a、b 和 c 的 值 没 有 变化 ， 因 此 我 们 可 以 重 
写 这 段 代 码 ， 如 程序 1-5 所 示 。 





程序 1-5 利用 常量 引用 参数 计算 一 个 表达 式 





template<class T> 
T abc(const T& a, const T& b, const T& c) 
{ 

retury 人 +S* G6; 


} 


用 关键 字 const 来 指明 函数 不 可 修改 的 引用 参数 ， 这 在 软件 工程 方面 具有 重要 意义 。 函 
数 头 告诉 用 户 该 函数 不 会 修改 实 参 。 

采用 程序 1-6 的 语法 ,我 们 可 以 得 到 程序 1-5 的 一 个 更 通用 的 版 本 。 在 新 的 版 本 中 ， 每 
个 形 参 可 以 是 不 同 的 数据 类 型 ， 而 函数 返回 值 的 类 型 与 第 一 个 形 参 类 型 相同 。 


程序 1-6 ”程序 1-5 的 一 个 更 通用 的 版 本 
template<class Ta, class Tb, class Tc> 
Ta abcl(Cconst Ta& a, const Tbé& b, const Tc& c) 
{ 
Peturn E+ BD * 记 和 


} 





1.2.5 返回 值 


一 个 函数 可 以 返回 一 个 值 、 一 个 引用 或 一 个 常量 引用 。 前 面 的 例子 都 是 返回 一 个 值 。 在 
这 种 情况 下 ， 返 回 的 对 象 被 复制 到 调用 环境 中 。 对 于 函数 abe 的 所 有 版 本 来 说 ， 这 种 复制 过 
程 都 是 必要 的 ， 因 为 函数 所 计算 出 的 表达 式 结果 被 存储 在 一 个 局 部 的 临时 变量 中 ， 当 函数 结 
束 时 ， 这 个 临时 变量 (以 及 所 有 其 他 的 临时 变量 、 局 部 变量 和 传 值 参数 ) 所 占用 的 空间 将 被 
释放 ， 其 值 当然 也 不 再 有 效 。 为 了 不 丢失 这 个 值 ， 在 释放 临时 变量 、 局 部 变量 以 及 传 值 参数 
的 空间 之 前 ， 要 把 这 个 值 从 临时 变量 复制 到 调用 该 函数 的 环境 中 去 。 
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给 函数 返回 类 型 增加 一 个 后 级 &， 我 们 便 指定 了 一 个 引用 返回 ( reference return )。 函数 头 
T& mystery(int i, T&z) 
定义 了 一 个 函数 mystery， 它 返回 的 是 类 型 T 的 一 个 引用 。 例 如 ， 可 以 使 用 下 面 的 语句 返回 z: 
return 2 
这 种 返回 形式 不 会 把 z 的 值 复 制 到 返回 环境 中 。 当 函数 结束 时 ， 形 参 i 以 及 所 有 局 部 变量 的 
空间 都 被 释放 。 因 为 z 仅 仅 是 对 一 个 实 参 的 引用 ， 所 以 它 不 受 影 响 。 
如 果 把 关键 字 const 加 在 函数 头 上 ， 便 得 到 const 型 引用 返回 ( const reference return ): 





Const T& mystery (int i, TE&z) 


const 引用 返回 与 引用 返回 是 类 似 的 ， 不 同 之 处 在 于 ，const 引用 返回 在 返回 调用 环境 时 ， 必 
须 将 值 赋 给 const 常量 。 


1.2.6 ” 重 载 函 数 


一 个 函数 的 签名 ( signature ) 是 由 这 个 函数 的 形 参 类 型 以 及 形 参 个 数 确 定 的 。 在 程序 1-1 
中 ， 函 数 abc 的 签名 是 (int,int,int )。C++ 可 以 定义 两 个 或 更 多 的 同名 函数 ， 但 是 任何 两 个 同 
名 的 函数 不 能 有 同样 的 签名 。 定 义 多 个 同名 函数 的 机 制 称 为 函数 重 载 ( function overloading )。 
有 了 也 数 重 载 ， 一 个 程序 可 以 包含 程序 1-1 的 函数 abc 和 程序 1-2 的 函数 abc。 将 函数 调用 语 
句 中 的 签名 与 函数 定义 中 的 签名 进行 匹配 ，C++ 编译 器 可 以 确定 是 哪 一 个 重 载 函 数 被 调用 了 。 


练习 


1. 解释 为 什么 程序 1-7 的 交换 函数 没有 把 形 参 x 和 y 所 对 应 的 实 参 的 值 交换 。 如 何 修改 代码 ， 
使 实 参 的 值得 到 交换 ? 


程序 1-7 交换 两 个 整数 的 不 正确 的 代码 
void swap (int x,int y) 
{VW 交换 整数 x 和 vy 
int temp=x; 
X=Y7 
y=temp’; 


} 





2. 编写 一 个 模板 函数 count， 返 回 值 是 数组 af0:n-1] 的 数值 个 数 。 测 试 你 的 代码 。 
3. 编写 一 个 模板 函数 fll， 给 数组 a[start:end-1] 赋值 value。 测 试 你 的 代码 。 


4. 编写 一 个 模板 函数 inner product， 返 回 值 是 Sali]* bl 测试 你 的 代码 。 


5. 编写 一 个 模板 函数 iota， 使 afij=value+i，0 三 1 一 n。 测试 你 的 代码 。 
6. 编写 一 个 模板 函数 is_sorted， 当 且 仅 当 a[0:n-1] 有 序 时 ， 返 回 值 是 true。 测 试 你 的 代码 。 
7. 编写 一 个 模板 函数 mismatch， 返 回 值 是 使 不 等 式 a[i] 关 b[i] 成 立 的 最 小 索引 i，0 三 1 一 ns 
8. 下 面 的 限 数 头 是 具有 不 同 签名 的 函数 吗 ? 为 什么 ? 

1) int abec (int a,int bint co) 

2) {float abe(int a,int b,int €) 
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9. 假设 有 一 个 程序 包含 了 程序 1-1 和 程序 1-2 的 abc 函数 。 下 面 的 语句 分 别 调用 了 哪 一 个 abe 
函数 ? 哪 一 条 语句 会 出 现 编译 错误 ? 为 什么 ? 
1) cout<<abc (1,2,3)<<endin; 
2) cout<<abc (1.0F,2.0F,3.0F) <<endln; 
3) cout<<abc (1,2,3.0F)<<endln; 
4) cout<<abc(1.0,2.0,3.0)<<endln; 


1.3 ”异常 
1.3.1 抛 出 异常 


异常 是 表示 程序 出 现 错误 的 信息 。 例如， 对 表达 式 atb*c+b/c 求 值 ， 如 果 a=2，b=1， 
c=0， 那 么 除数 就 是 0， 这 是 一 个 错误 。 对 这 个 错误 . 虽然 C++ 检查 不 出 来 ,但 是 硬件 会 检查 
出 来 ， 并 抛 出 一 个 异常 。 

我 们 可 以 编写 这 样 的 C++ 程序 ， 它 可 以 对 一 些 异 常情 况 进行 检查 ， 而 且 当 查 出 一 个 异常 
时 ， 就 抛 出 异常 。 例 如 ， 程 序 1-1 的 函数 abc 可 以 定义 为 ， 仅 当 三 个 参数 都 大 于 0 时 才 计 算 
表达 式 的 值 。 如 果 有 一 个 或 多 个 参数 的 值 不 大 于 0， 就 可 以 抛 出 异常 ， 表 明 有 异常 出 现 ， 如 
程序 1-8 所 示 。 这 个 程序 所 抛 出 的 异常 类 型 是 char*。 


程序 1-8 抛 出 一 个 类 型 为 char 的 异常 
int. abe(int dr int, by int &) 
{ 
i a 0 1 半 0) 
throw "All parameters should be > 0"; 
return at bb * ey 


} 


程序 可 能 抛 出 的 异常 有 很 多 类 型 ， 例 如 0 除数、 非法 参数 值 、 非 法 输入 值 、 数 组 下 标 越 
界 等 。 如 果 对 每 一 种 类 型 的 异常 都 定义 一 个 异常 类 ， 那 么 异常 处 理 就 有 了 更 多 的 灵活 性 。 例 
如 ，C++ 具有 一 个 异常 类 的 层次 结构 ， 类 exception 是 根 。 标 准 C++ 函数 通过 抛 出 一 种 异常 来 
表明 异常 的 出 现 ， 而 这 种 异常 是 从 基 类 exception 派生 的 类 型 。 例 如 ，C++ 的 动态 内 存 分 配 操 
作 符 new， 在 得 不 到 内 存 空间 分 配 时 ， 就 抛 出 类 型 为 bad_alloc 的 异常 ， 而 bad_alloc 是 一 种 
从 基 类 exception 派生 的 类 型 。 类 似 的 ， 确 定 一 个 对 象 类 型 的 C++ 函数 typeid， 在 遇 到 NULL 
对 象 时 , 就 会 抛 出 类 型 为 bad typeid 的 异常 ， 而 bad _ typeid 也 是 从 基 类 exception 派生 的 。 在 
1.6 节 ， 我 们 将 介绍 如 何 定 义 异 常 类 。 


1.3.2 ”处 理 异常 


一 段 代 码 抛 出 的 异常 由 包含 这 段 代 码 的 try 块 来 处 理 。 紧 跟 在 try 块 之 后 的 是 catch 块 。 每 
一 个 catch 块 都 有 一 个 参数 ， 参 数 的 类 型 决定 了 这 个 catch 块 要 捕捉 的 异常 的 类 型 。 例 如 ， 块 
catch (char *e){} 
捕捉 的 异常 类 型 是 char*， 而 块 


catch (badq alloc e)1{l} 
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捕捉 的 异常 类 型 是 bad_alloc。 块 
catch (exceptiong e)1} 


捕捉 的 异常 类 型 是 基 类 型 exception 以 及 所 有 从 exception 派生 的 类 型 ( 例如 bad alloc 和 bad_ 
typeid )。 块 


Gatel(. .1} 


捕捉 所 有 异常 ,不管 是 什么 类 型 。 

catch 块 一 般 包 含 异常 改正 之 后 所 恢复 的 代码 。 如 果 不 可 能 恢复 ， 那 么 catch 块 的 代码 输 
出 报错 信息 。 程 序 1-9 给 出 了 一 个 try-catch 结构 示例 。 在 try 块 中 调用 的 函数 abc 是 程序 1-8 
给 出 的 。 

在 程序 1-9 的 try 块 之 后 只 有 一 个 catch 块 ， 其 实 可 以 有 多 个 catch 块 。 如 果 在 一 个 try 块 
之 内 的 代码 结束 时 没有 发 生 异 常 ， 那 么 catch 块 就 被 忽视 了 。 如 果 一 个 异常 被 抛 出 ， 那 么 try 
块 的 正常 运行 停止 ， 程 序 进 入 第 一 个 能 够 捕捉 到 这 种 异常 类 型 的 catch 块 。 在 这 个 catch 块 执 
行 完 之 后 ， 其 他 的 catch 块 就 被 忽略 了 。 如 果 没 有 一 个 catch 块 能 够 与 抛 出 的 异常 类 型 相对 
应 ， 那 么 异常 就 会 跨越 做 入 在 try 块 里 的 层次 结构 ， 寻 找 在 层次 结构 中 能 够 处 理 这 个 异常 的 第 
一 个 catch 块 。 如 果 该 异常 没有 被 任何 catch 块 捕捉 ， 那 么 程序 非 正常 停止 。 


程序 1-9 ”捕捉 一 个 类 型 为 char* 的 异常 
int main() 
{ 
try {cout << abc(2,0,4) << endl;} 
catch (char* e) 
{ 
cout << "The parameters to abc were 2, 0, and 4" << endl; 
cout << "An exception has been thrown" << endl; 
cout << e << endl; 
return 1; 
} 
return 0; 
} 


当 程 序 1-9 运行 时 ，abc 函数 抛 出 了 一 个 类 型 为 char* 的 异常 。 这 个 异常 使 函数 abc 还 没 
有 计算 表达 式 的 值 就 停止 了 。 块 try 也 立即 停止 了 ， 其 中 的 cout 语句 没有 执行 完 。 因 为 抛 出 
的 异常 与 catch 块 的 参数 e 是 同一 种 类 型 ， 所 以 异常 被 这 个 catch 块 捕 提 ，e 的 赋值 是 抛 出 的 
异常 ， 然 后 进入 catch 块 。 图 1-1 给 出 的 是 由 程序 1-9 产生 的 输出 结果 。 


The Parameters to abc were 2, 0, and 4 
An exception has been thrown 
All parameters should be > 0 


图 1-1 程序 1-9 的 输出 结果 


练习 


10. 修改 程序 1-8， 使 抛 出 的 异常 类 型 是 整 型 。 如 果 a、b、c 都 小 于 0， 那 么 抛 出 的 异常 值 是 1; 
如 果 a、b、c 都 等 于 0， 那 么 抛 出 的 异常 值 是 2。 否 则 没有 异常 。 编 写 一 个 主 函 数 ， 应 用 
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修改 后 的 代码 ; 若 有 异常 抛 出 ， 则 捕 提 异常 ; 根据 异常 值 输出 信息 。 测 试 你 的 代码 。 
11. 重 做 练习 2。 不 过 ， 当 ns<l 时 ， 抛 出 类 型 为 char* 的 异常 。 测 试 你 的 代码 。 


1.4 动态 存储 空间 分 配 
1.4.1 操作 符 new 


C++ 操作 符 new 用 来 进行 动态 存储 分 配 或 运行 时 存储 分 配 ， 它 的 值 是 一 个 指针 ， 指 向 所 
分 配 空间 。 例 如 ， 要 给 一 个 整数 动态 分 配 存储 空间 ， 必 须 利 用 下 面 的 语句 声明 一 个 整 型 指针 
变量 ( 例如 y ): 

宇 玉 世相 
当 程 序 需 要 这 个 整数 时 ， 就 使 用 下 面 的 语句 为 这 个 整数 动态 分 配 存储 空间 : 


y=new int; 


操作 符 new 分 配 了 一 块 能 够 存储 一 个 整数 的 空间 ， 并 将 该 空间 的 指针 赋 给 y，y 是 对 整数 指针 
的 引用 ， 而 *y 是 对 整数 本 身 的 引用 。 要 在 动态 分 配 的 空间 中 存储 一 个 整数 值 ， 例 如 10， 可 
以 使 用 下 面 的 语句 : 

xyYy=107 


我 们 可 以 把 上 述 三 个 步骤 (声明 y， 动 态 存储 分 配 ， 为 *y 赋值 ) 合并 为 下 面 的 形式 : 


int*y=new int; 
*y=10} 


int *y=new int (10); 
或 
rE yy 


y=new int(10) ， 


1.4.2 一 维 数组 


本 书 列举 的 许多 函数 都 使 用 了 一 维 或 二 维 数组 ， 这 些 数 组 的 大 小 在 编译 时 可 能 还 是 未 知 
的 ， 它 们 随 着 函数 调用 的 变化 而 变化 ， 因 此 ， 对 这 些 数组 只 能 进行 动态 存储 分 配 。 

为 了 在 运行 时 创建 一 个 一 维 浮 点 型 数组 x， 必 须 把 x 声明 为 一 个 浮 点 型 指针 ， 然 后 为 数 
组 分 配 足 够 的 空间 。 例 如 ， 一 个 长 度 为 n 的 一 维 浮 点 数组 可 以 按 如 下 方式 来 创建 : 

float*x=new float [nj]; 
操作 符 new 为 n 个 浮 点 数 分 配 了 存储 空间 ， 并 返回 第 一 个 浮 点 数 空间 的 指针 。 对 每 个 数组 元 
素 的 访问 可 以 用 x[0],x[1],…,x[n-1] 的 形式 。 


1.4.3 ”异常 处 理 
执行 语句 


10 ” 甸 一 亡 分 “ 预 和 冀 和 天 


float *x=new float [n]; 


可 能 出 现 这 样 的 情况 ， 对 mn 个 浮 点 数 ， 计 算 机 没有 足够 的 内 存 可 以 分 配 。 在 这 样 的 情况 下 ， 
操作 符 new 也 不 会 分 配 内 存 ， 而 是 抛 出 一 个 类 型 为 bad alloc 的 异常 。 利 用 try-catch 结构 ， 我 
们 可 以 捕获 这 个 因 new 操作 失败 而 引发 的 异常 : 

foat*xs 

try{x=new float [nj];} 

catch (bad alloc e) 

{1/ 仅 当 new 失败 时 才 会 进入 

Cerr<<"Out of Memory"<<endl; 


Exit (1)s 
} 


1.4.4 操作 符 delete 


动态 分 配 的 存储 空间 不 再 需要 时 应 该 把 它 释放 。 释 放 的 空间 可 重新 用 来 动态 分 配 。C++ 
操作 符 delete 用 来 释放 由 操作 符 new 所 分 配 的 空间 。 下 面 的 语句 用 来 释放 分 配给 *y 和 一 维 数 
组 x 的 空间 ; 


delete y; 
delete []x; 


1.4.5 二 维 数 组 


虽然 C++ 采用 多 种 机 制 来 说 明 二 维 数 组 ， 但 是 这 些 机 制 大 多 要 求 在 编译 时 就 知道 两 维 的 
大 小 。 具 体 来 说 ,使 用 这 些 机 制 很 难 编写 出 这 样 的 函数 ， 它 的 形 参 是 一 个 第 二 维 大 小 未 知 的 
二 维 数组 。 之 所 以 如 此 ， 是 因为 当 形 参 是 一 个 二 维 数组 时 ， 必 须 指 定 第 二 维 的 大 小 。 例 如 ， 
a[][10] 是 一 个 合法 的 形 参 ， 而 a[][] 就 不 是 。 

克服 这 种 限制 的 一 条 有 效 方法 就 是 对 所 有 二 维 数 组 使 用 动态 存储 分 配 。 本 书 从 头 至 尾 都 
使 用 动态 分 配 的 二 维 数组 。 

当 二 维 数组 的 两 维 大 小 在 编译 时 都 是 已 知 时 ， 可 以 采用 类 似 于 创建 一 维 数 组 的 语法 来 创 
建 二 维 数 组 。 例 如 ， 一 个 类 型 为 char 的 7x5 的 二 维 数组 可 用 下 面 的 语法 来 声明 : 


char cl[7][5]; 


如 果 在 编译 时 至 少 有 一 维 的 大 小 是 未 知 的 ， 那 么 数组 空间 必须 在 运行 时 利用 操作 符 new 
来 创建 。 假 定 一 个 二 维 字符 型 数组 ， 在 编译 时 已 知 列 数 为 5， 可 采用 如 下 语法 来 动态 分 配 存 
储 空间 : 

Ciliar(*e) [3]? 

try{c=new char[n] [5];} 

catch (bad alloc) 

{1/ 仅 当 new 失败 时 才 会 进入 

Cerr <<"Out of Memory" <<endl; 


exXIiE(L)F 


} 


在 运行 时 ， 这 种 数组 的 行 数 n 要 么 通过 计算 来 确定 ， 要么 由 用 户 通 过 输入 来 指定 。 如 果 数 组 
的 列 数 在 编译 时 也 是 未 知 的 ， 那 么 不 可 能 仅 调用 一 次 new 就 能 创建 这 个 二 维 数组 ( 即使 数组 
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的 行 数 在 编译 时 是 已 知 的 )， 要 构造 这 样 的 二 维 数 组 ， 可 以 把 它 看 做 是 由 若干 行 所 构成 的 结 
构 ， 每 一 行 都 是 一 个 能 用 new 来 创建 的 一 维 数组 。 指 向 每 一 行 的 指针 保存 在 男 外 一 个 一 维 数 
组 之 中 。 图 1-2 给 出 了 建立 一 个 3 x5 数组 x 所 需要 的 结构 。 

x[0]、x[1] 和 x[2] 分 别 指向 第 0 行 、 第 1 行 和 第 2 行 的 首 元 素 。 如 果 x 是 一 个 字符 数组 ， 
那么 x[0:2] 是 指向 字符 的 指针 ， 而 x 本 身 是 一 个 指向 指针 的 指针 ，x 的 声明 语法 如 下 所 示 : 


Char **Rs 


程序 1-10 创建 了 一 个 如 图 1-2 所 示 的 存储 结构 。 该 程序 创建 一 个 类 型 为 了 的 二 维 数组 。 这 
个 数组 的 行 数 是 numberOfRows， 列 数 是 numberOfColumns。 程 序 首先 为 指针 x[0],…， 
x[numberOfRows-1] 申请 空间 ， 然 后 为 数组 的 每 一 行 申请 空间 。 在 程序 1-10 中 ， 操 作 符 
new 被 调用 numberOfRows+1 次。 如 果 new 的 
某 一 次 调用 引发 了 一 个 异常 ， 程 序 控制 将 转移 
到 catch 块 ， 并 返回 false。 如 果 new 的 每 一 次 
调用 都 没有 出 现 异 常 ， 那 么 数组 创建 成 功 。 郴 
数 返回 true。 对 创建 的 数组 x， 每 个 元 素 都 可 
以 使 用 标准 下 标 法 x[i][] 来 引用 ,其 中 0 大 i 一 


numberOfRows,0 < j = numberOfColumns- 


[0] fl 他 3 14] 





图 1-2 一 个 3x5 数组 的 存储 结构 


程序 1-10 ”为 一 个 二 维 数组 分 配 存 储 空间 





template <class T> 
bool make2dArray(T ** &x, int numberOfRows, int numberOfColumns) 


{1/ 创建 一 个 二 维 数组 


try { 
// 创建 行 指针 


xX= new T * [numberOfRows]; 


// 为 每 一 行 分 配 空间 
for (int i = 0; i < numberOfRows; i++) 
x[i] = new int [numberOfColumns]; 
FeCULT true} 
} 
catch (bad alloc) {return false;} 
} 


在 程序 1-10 的 函数 中 ，new 抛 出 的 异常 ( 如 果 有 异常 的 话 ) 是 通过 函数 返回 的 布尔 型 
值 false 来 告知 调用 者 的 。 其 实 ， 了 水 数 make2dArray 在 异常 出 现时 可 以 什么 都 不 做 。 对 程 
序 1-11， 调 用 者 可 以 捕获 操作 符 new 抛 出 的 任何 异常 。 


程序 1-11 创建 一 个 二 维 数 组 ， 没 有 异常 处 理 





template <class T> 
void make2dArray(T ** &X int numberOfRows, int numberOfColumns) 


{1/ 创建 一 个 二 维 数组 


// 创建 行 指针 


X= new T * [numberOfRows]; 


// 为 每 一 行 分 配 空间 
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for (int i = 0; i < numberOfRoOws; i++) 
x[i] = new T [numberOfColumns]; 
} 


当 make2dArray 按 程序 1-11 定义 时 ,我 们 使 用 如 下 代码 来 确定 存储 分 配 是 否 成 功 : 


try{make2dArray (x, r, c);} 
catch (bad alloc) 

{ 

Cerr<<'"Could not create x"<<endql: 
让 次 沁 所 表 寺 》 


} 


在 函数 make2dArray 中 ,没有 异常 捕获 ,这 不 仅 简 化 了 也 数 的 代码 设计 ， 而 且 使 异常 捕获 落 
在 一 个 更 适合 报告 错误 或 修改 错误 的 地 方 。 

我 们 分 两 步 来 释放 程序 1-10 的 二 维 数组 空间 ， 首 先 释放 在 for 循环 中 为 每 一 行 所 分 配 的 
空间 ， 然 后 释放 为 行 指针 (row pointer ) 所 分 配 的 空间 ， 见 程序 1-12。 注 意 ， 在 程序 1-12 中 
x 被 置 为 0， 这 是 为 了 防止 用 户 继续 访问 已 被 释放 的 空间 。 


程序 1-12 ”释放 在 函数 make2dArray 中 分 配 的 空间 


template <class T> 
void delete2dArray(T ** &x, int numberOfRows) 


{// 删除 二 维 数组 x 


/ 删除 行 数组 空间 
for (int i = 0; i < numberOfRows; i++) 
delete [] x[il]; 


1/ 删除 行 指针 
delete [] x; 
x = NULL; 


练习 


12. 为 程序 make2dArray ( 程序 1-11 ) 编写 一 个 通用 型 算法 ， 它 的 第 三 个 参数 不 是 整数 
numberOfColumns， 而 是 一 维 数组 rowSize。 它 创建 一 个 二 维 数组 ， 第 i 行 的 列 数 是 
IOwSize[i] 。 

13. 编 写 一 个 模板 函数 changeLengthliID， 它 将 一 个 一 维 数 组 的 长 度 从 oldLength 变 成 
newLength。 困 数 首先 分 配 一 个 新 的 、 长 度 为 newLength 的 数组 ， 然 后 把 原 数组 的 前 
min{oldLength，newLength} 个 元 素 复 制 到 新 数组 中 ， 最 后 释放 原 数 组 所 占用 的 空间 。 测 
试 你 的 代码 。 

14. 编写 一 个 函数 changeLength2D， 它 改变 一 个 二 维 数组 的 大 小 ( 见 练习 13 )。 测 试 你 的 代码 。 


1.5 自 有 数据 类 型 
1.5.1 类 currency 
C++ 语言 支持 诸如 int、float 和 char 这 样 的 数据 类 型 。 而 本 书 的 许多 应 用 所 需要 的 数据 
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类 型 是 C++ 不 支持 的 ， 需 要 自己 定义 。 定 义 自 有 数据 类 型 最 灵活 的 方式 就 是 使 用 C++ 的 类 
(class ) 结构 。 假 定 你 想 处 理 货币 类 型 currency 的 对 象 ( 也 称 实例 )， 这 种 对 象 有 三 个 成 员 : 
符号 (+ 或 - )、 美 元 和 美 分 。 例 如 , $2.35 (2 美元 , 35 美 分 ， 符 号 是 +, ) 和 -$6.05 (6 美元 ， 
5 美 分 ， 符号 是 - )。 对 这 种 对 象 我 们 想 要 执行 的 操作 如 下 : 

e 给 成 员 赋 值 。 
确定 成 员 值 ( 即 符号 、 美 元 数目 和 美 分 数目 )。 
e 两 个 对 象 相 加 。 
增加 成 员 的 值 。 

e 输出 。 

假定 用 无 符号 长 整 型 变量 dollars 、 无 符号 整 型 变量 cents 和 signType 类 型 变量 sign 来 描 
述 货 币 对 象 ， 其 中 signType 类 型 的 定义 如 下 : 


enum signType{plus, minus}; 


程序 1-13 用 C++ 定义 了 一 个 相应 的 货币 类 。 第 一 行 仅仅 声明 了 类 的 名 称 currency， 而 类 的 成 
员 声 明 包 含 在 其 后 的 一 对 {} 中 。 类 的 成 员 声 明 有 两 个 部 分 : 公有 (public ) 和 私有 (private )。 
公有 部 分 所 声明 的 是 用 来 操作 类 对 象 (或 实例 ) 的 成 员 函 数 (又 称 方法 )。 它 们 对 类 的 用 户 是 
可 见 的 ， 是 用 户 与 类 对 象 进行 交互 的 唯一 手段 。 私 有 部 分 所 声明 的 是 用 户 不 可 见 的 数据 成 员 
(如 简单 变量 、 数 组 及 其 他 可 赋值 的 结构 ) 和 成 员 函 数 。 通 过 公有 部 分 和 私有 部 分 ， 我 们 可 以 
让 用 户 只 看 到 他 们 需要 看 到 的 部 分 ， 同 时 把 其 余 的 部 分 隐藏 起 来 ， 这 部 分 通常 是 与 实现 细节 
有 关 的 内 容 。 尽 管用 C++ 语法 可 以 在 公有 部 分 声明 数据 成 员 ， 但 是 优秀 的 软件 设计 者 不 会 这 
样 做 。 


程序 1-13 ”currency 类 声明 
class currencey 
{ 
BUSBlLGS 
// 构造 函数 
currency (signType theSign = Plus， 
unsigned long theDollars = 0， 
unsigned int theCents = 0);}; 
1/ 析 构 函数 
~currency() {1} 
void setValue (signType, unsigned long, unsigned int); 
void setValue (double); 
signType getSign() const {return sign;} 
unsigned long getDollars() const {return dollars;} 
unsigned int getCents() const {return cents;} 
currency addl(const currency&) const; 
Currency& increment (const currency&); 


void output() const; 

private: 
signType sign; // 对 象 的 符号 
unsigned long dollars; 1/ 美元 的 数量 
unsigned int cents; 1// 美 分 的 数量 


}s 





公有 部 分 的 第 一 个 成 员 函 数 与 类 名 相同 ， 这 种 名 称 与 类 名 相同 的 成 员 函 数 称 为 构造 
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( constructor ) 函数 。 构 造 函 数 指明 了 创建 一 个 类 对 象 的 方法 ， 而 且 没 有 返回 值 。 在 本 例 中 ， 
构造 函数 有 三 个 参数 ， 其 缺 省 值 分 别 是 plus、0 和 0。 构造 函数 的 实现 在 本 节 稍 后 的 部 分 给 
出 。 在 创建 一 个 currency 类 对 象 时 ， 构 造 函 数 被 自动 调用 。 创 建 currency 类 对 象 有 如 下 两 种 
方式 

currency f,g (plus,3,45), h (minus,10); 

currency *m= new currency (plus,8,12); 


第 一 行 声 明了 三 个 currency 类 对 象 : f、g 和 h。 其 中 上 f 用 缺 省 值 (plus, 0, 0 ) 初始 化 ， 结 
果 是 $0.00 ; g 的 初始 化 结果 是 $3.45，h 的 初始 化 结果 -$10.00。 注 意 ， 初 始 值 从 左 至 右 分 别 
与 构造 函数 的 参数 对 应 。 如 果 初 始 值 的 个 数 少 于 构造 函数 的 参数 个 数 ， 简 下 的 参数 取 缺 省 值 。 
在 第 二 行 声 明了 一 个 currency 类 的 指针 m。 调 用 new 操作 符 创建 一 个 currency 对 象 ， 并 把 对 
象 的 指针 存储 在 m 中 ， 对 象 初始 化 的 结果 是 $8.12。 

下 一 个 成 员 函 数 是 ~currency， 比 类 名 多 了 一 个 前 级 (~)， 这 种 成 员 困 数 称 为 析 构 
( destructor ) 函数 。 每 当 一 个 currency 类 对 象 超出 作用 域 时 ， 析 构 函 数 就 被 自动 调用 来 删除 
这 个 对 象 。 在 本 例 中 的 析 构 函数 被 定义 为 空 函 数 ( {} )。 不 过 在 其 他 类 中 ， 析 构 函 数 可 能 不 
是 空 函数 。 例 如 ， 构 造 函 数 可 能 创建 了 动态 数组 ， 那 么 当 对 象 超出 作用 域 时 ， 析 构 函 数 需 要 
释放 动态 数组 空间 ， 这 时 的 析 构 函数 就 不 是 空 函 数 。 与 构造 函数 一 样 ， 析 构 函 数 也 没有 返 
回 值 。 

接 下 来 的 两 个 函数 供用 户 为 currency 类 对 象 赋值 。 第 一 个 函数 共有 三 个 参数 ， 而 第 二 个 
函数 仅 有 一 个 参数 。 这 两 个 函数 的 具体 实现 在 本 节 稍 后 给 出 。 请 注意 ， 这 两 个 函数 的 名 字 相 
同 ， 但 是 它们 的 签名 不 同 ， 编 译 器 和 用 户 很 容易 区 分 它们 。 还 要 注意 ， 这 两 个 函数 没有 指定 
赋值 ( 符号， 美元 ， 美 分 ) 对 象 的 名 称 ， 这 是 因为 调用 类 成 员 函 数 的 语法 是 ; 


g.setValue (minus,33,0); 
h.setValue (20 .52); 


其 中 g 和 hh 是 currency 类 对 象 ， 也 是 函数 的 赋值 对 象 。 在 第 一 个 句子 中 , g 是 调用 
setValue 的 对 象 ， 在 第 二 个 句子 中 , h 是 调用 setValue 的 对 象 。 在 编写 函数 setValue 的 代码 时 ， 
我 们 有 办 法 访问 调用 该 函数 的 对 象 ， 因 此 ， 不 需要 把 调用 对 象 的 名 称 放 人 人 参数 表 中 。 

成 员 函 数 getSign、getDollars 和 getCents 返回 调用 对 象 的 相应 数据 成 员 ， 关 键 字 const 指 
明 这 些 函 数 不 会 改变 调用 对 象 的 值 。 我 们 把 这 种 函数 称 为 常量 函数 ( constant function )。 

成 员 函 数 add 把 调用 对 象 的 货币 值 与 参数 对 象 ( 即 作为 参数 的 currency 类 对 象 ) 的 货币 
值 相 加 ， 然 后 返回 相 加 后 的 结果 。 因 为 这 个 成 员 函 数 不 会 改变 调用 对 象 的 值 ， 所 以 它 是 一 个 
常量 函数 。 成 员 函 数 increment 把 参数 对 象 的 货币 值 加 到 调用 对 象 上 ， 这 个 函数 改变 了 调用 对 
象 的 值 ， 因 此 它 不 是 一 个 常量 函数 。 最 后 一 个 成 员 函 数 是 output， 它 把 调用 对 象 插 和 人 输出 流 
cout 中 来 显示 它 的 值 。output 不 会 改变 调用 对 象 ， 因 此 是 一 个 常量 函数 。 

尽管 add 和 increment 都 返回 currency 类 对 象 ， 但 add 返回 的 是 对 象 的 值 ， 而 increment 
返回 的 是 对 象 的 引用 。1.2.5 节 已 经 提 到 ， 返 回 值 和 返回 引用 分 别 与 传 值 参 数 和 引用 参数 有 相 
同 的 作用 。 返 回 对 象 的 值 是 将 返回 的 对 象 复制 到 返回 的 环境 。 而 返回 对 象 的 引用 则 避免 了 这 
种 复制 。 该 对 象 在 返回 的 环境 中 可 以 直接 引用 。 返 回 引 用 比 返回 值 要 快 ， 因 为 不 用 复制 对 象 。 
成 员 函 数 add 返回 的 是 一 个 该 函数 的 局 部 对 象 ， 在 函数 终止 时 这 个 局 部 对 象 被 删除 ， 因 此 ， 
return 语句 必须 复制 该 对 象 。 而 成 员 函 数 increment 返回 的 是 该 函数 的 调用 对 象 ， 因 而 不 需要 
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复制 。 

程序 1-13 没有 指定 复制 构造 ( copy constructor ) 函数 ，C++ 将 使 用 缺 省 复制 构造 函数 ， 
仅仅 复制 数据 成 员 。 对 于 类 currency 来 说 ， 缺 省 复制 构造 函数 已 经 足够 了 。 后 面 还 有 一 些 类 ， 
对 于 它们 ， 缺 省 复制 构造 函数 就 不 够 了 。 

私有 部 分 声明 了 三 个 数据 成 员 ， 用 来 表示 一 个 currency 类 对 象 。 每 一 个 currency 类 对 象 
都 有 这 三 个 数据 成 员 。 

成 员 函 数 如 果 不 在 类 声明 体内 部 实现 ， 而 在 外 部 实现 ， 就 必须 使 用 作用 域 说 明 符 ( scope 
resolution operator ) :: 以 指明 该 函数 是 currency 类 的 成 员 函 数 。 因 此 currency::currency 表示 
currency 类 的 构造 明 数 ， 而 currency::output 表示 currency 类 的 output 成 员 因 数 。 程 序 1-14 实 
现 了 currency 类 的 构造 图 数 ， 它 仅仅 调用 了 具有 三 个 参数 的 成 员 函 数 setValue 来 给 对 象 的 数 
据 成 员 初 始 化 。 


程序 1-14 ”currency 的 构造 函数 


Currency: :currency (signType theSign, unsigned long theDollars, unsigned int theCents) 
{// 创建 一 个 currency 类 对 象 

setValue (theSign, theDollars, theCents); 
} 





程序 1-15 是 两 个 成 员 函 数 setValue 的 代码 。 第 一 个 成 员 项 数 首先 验证 参数 值 的 合法 性 。 
只 有 参数 值 合 法 ， 才 能 用 来 给 调用 对 象 的 私有 数据 成 员 赋 值 。 如 果 参 数值 不 合法 ， 就 抛 出 一 
个 类 型 为 illegalParametervalue 的 异常 ( 1.6 节 介 绍 )。 第 二 个 成 员 函 数 不 验 证 参数 值 的 合法 
性 ， 仅 使 用 小 数 点 后 面 头 两 个 数字 。 不 过 要 注意 ， 对 形 如 di.qzq 的 数 ， 用 计算 机 表示 可 能 是 
不 精确 的 。 例 如 ， 用 计算 机 表示 数值 5.29 时 ， 可 能 要 比 5.29 稍微 小 一 点 。 如 果 用 语句 


cents = (unsigned int) ((theAmount - dollars) * 100); 


来 抽取 美 分 的 值 ， 那 么 用 计算 机 来 表示 就 要 出 错 ， 因 为 (theAmount-dollars)*100 要 比 29 稍 
微小 一 点 ， 当 程序 再 把 它 转换 成 一 个 整数 时 ， 赋 给 cents 的 值 是 28 而 不 是 29。 解 决 这 个 问题 
的 方法 是 给 theAmount 加 上 0.001， 这 时 ， 只 要 di.qq; 用 计算 机 表示 后 与 实际 值 相 比 不 少 于 
0.001 或 不 多 于 0.009， 结 果 就 是 正确 的 。 例 如 ， 如 果 5.29 用 计算 机 表示 是 5.289 99， 那 么 加 
上 0.001 将 得 到 5.290 99， 这 样 一 来 ， 赋 给 cents 的 值 就 等 于 29。 


程序 1-15 ”给 私有 数据 成 员 赋 值 


void currency::setValue (signType theSign，unsigned long theDollars, 
unsigned int theCents) 
{VW 给 调用 对 象 的 数据 成 员 赋 值 
if (theCents > 99) 1/ 美 分 太 多 
throw illegalParameterValue ("Cents should be < 100") 7 


sign = theSign; 
dollars = theDollars; 
cents = theCents; 


} 


void currency::setValue (double theAmount) 

{1/ 给 调用 对 象 的 数据 成 员 赋 值 
if (theAmount < 0) {sign = minus; theAmount = -theAmount;} 
else sign = plus; 
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dollars = (unsigned long) theAmount; // 提取 整数 部 分 
cents = (unsigned int) ((theAmount + 0.001 - dollars) * 100);// 提 取 两 位 小 数 
} 


程序 1-16 是 方法 add 的 代码 ， 它 首先 把 要 相 加 的 两 个 对 象 转换 为 整数 ， 如 $2.32 转换 成 
232，-$4.75 转换 成 -475。 注 意 ， 引 用 调用 对 象 的 数据 成 员 与 引用 参数 对 象 x 的 数据 成 员 在 
语法 上 是 有 区 别 的 。x.dollars 指 的 是 x 的 数据 成 员 ， 而 前 面 没有 对 和 象 名 称 的 dollars 指 的 是 调 
用 对 象 的 数据 成 员 。 当 方法 add 终止 时 ， 局 部 变量 al 、a2、a3 和 ans 被 析 构 函数 删除 ， 它 们 
的 空间 被 释放 。 而 currency 类 对 象 result 是 add 的 局 部 对 象 ， 它 作为 调用 的 返回 值 必须 复制 
到 调用 环境 中 。 因 此 add 必须 是 值 返回 。 


程序 1-16 ”把 两 个 currency 对 象 的 值 相 加 


currency currency::add(const currencyg& x) const 
{1/ 把 x 和 *this 相 加 

long' al;, a2r a3; 

currency result; 


1/ 把 调用 对 象 转化 为 符号 整数 
al = dollars * 100 + cents; 
it (sign == minus) al = -al; 


/把 x 转 化 为 符号 整数 
a2 三 %.. dollars * 100 十 .centsr 
if (x.sign == minus) a2 = -a2; 


a3 = al + a2; 


// 转换 为 currency 对 象 的 表达 形式 

if (a3 < 0) {result.sign = minus; a3 = -a3;} 
else result,sign = plus; 

result.dollars = a3 / 100; 

result.cents = a3 - result.dollars * 100; 


return result; 
} 


程序 1-17 是 方法 increment 和 output 的 代码 。 在 C++ 中， 保留 关键 字 this 指向 调用 对 
象 ，*this 便 是 调用 对 象 。 以 调用 语句 g.increment(h) 为 例 ， 方 法 increment 第 一 行 语句 调用 
公有 成 员 函 数 add， 它 把 x ( 即 h ) 与 调用 对 象 g 相 加 ， 然 后 把 相 加 的 结果 作为 返回 值 赋 给 
*#this， 而 *this 就 是 g。 因 此 g 的 值 增加 了 x ( 即 h)。 方法 increment 的 返回 值 是 *this，*this 
是 调用 对 象 g。 因 为 这 个 对 象 不 是 increment 的 局 部 对 象 ， 当 increment 结束 时 ，g 的 空间 不 会 
自动 释放 ， 所 以 我 们 使 用 了 返回 引用 ， 这 样 就 省 去 了 返回 值 的 复制 过 程 。 


程序 1-17 ”函数 increment 和 output 
Currencyé& currency::increment (const currency& x) 
{1/ 增加 x 
*this = add (x); 
etnrn “Ehiss 


} 


void currency::output() const 
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{1/ 输出 调用 对 象 的 值 
if (sign == minus) cout << '-—'; 
cout < "S$' < UGLLars < "2a 
i (cents < LO cout < ‘QO; 
cout << cents; 


} 


类 currency 的 数据 成 员 已 经 设 为 私有 (private )， 类 的 用 户 不 能 直接 访问 这 些 成 员 。 因 
此 ， 用 户 通 过 下 面 的 语句 直接 改变 私有 数据 成 员 的 值 是 允许 的 : 

h.cents=20; 

h.dollars=100;} 

h.sign=plus; 

如 果 数 据 成 员 在 处 理 之 前 是 有 效 的 ， 而 且 经 过 成 员 函 数 处 理 之 后 依然 是 有 效 的 ， 那 么 我 
们 就 能 够 保证 它们 在 经 过 用 户 程 序 处 理 之 后 依然 是 有 效 的 ， 因 为 用 户 程 序 是 通过 成 员 函 数 来 
处 理 数据 成 员 的 。 构 造 函 数 和 成 员 函 数 setValue 的 代码 在 使 用 数据 之 前 都 要 验证 它 的 有 效 性 。 
而 其 余 成 员 函 数 的 特性 是 : 如 果 数 据 在 处 理 前 是 有 效 的 ,那么 在 处 理 之 后 也 是 有 效 的 。 由 于 
构造 函数 和 成 员 函 数 setValue 已 经 保证 了 数据 成 员 的 有 效 性 ， 所 以 ， 诸 如 add、output 等 成 员 
函数 的 代码 在 处 理 之 前 不 必 验 证 数据 成 员 。 可 是 ， 如 果 把 数据 成 员 声 明 为 公有 成 员 ， 那 就 不 
一 样 了 。 例 如 ， 用 户 可 能 直接 赋 给 cents 一 个 无 效 值 305， 从 而 导致 一 些 成 员 函 数 ( 如 output ) 
的 结果 有 误 。 在 这 种 情况 下 ， 所 有 成 员 函 数 的 代码 都 需要 在 处 理 之 前 验证 数据 成 员 。 这 样 一 
来 ， 代 码 运行 速度 就 会 降低 ， 代 码 也 不 那么 精简 了 。 

程序 1-18 是 类 currency 的 一 个 应 用 示例 。 这 段 代 码 假 定 类 声明 和 类 实现 都 在 文件 
currency.h 之 中 。 我 们 一 般 把 类 声明 和 类 实现 分 放 在 不 同 的 文件 中 ， 然 而 这 种 分 置 对 后 续 章节 
要 引入 的 大 量 模板 函数 和 模板 类 是 行 不 通 的 。 

主 函 数 main 的 第 一 行 声 明了 4 个 currency 类 对 象 g、h、i 和 j。 构 造 昂 数 使 h 的 初始 
值 是 $3.30， 甚 余 的 都 是 $0.00。 接 下 来 的 两 行 调 用 成 员 函 数 setValue， 将 g 和 i 分 别 赋值 
为 -$2.25 和 -$6.45。 下 面 是 调用 成 员 函 数 add， 它 把 g 和 bh 加 在 一 起 ， 返 回 一 个 值 为 $1.25 的 
对 象 ， 然 后 通过 缺 省 赋值 函数 把 右 侧 对 象 的 数据 成 员 复制 给 左 侧 对 象 所 对 应 的 数据 成 员 。 复 
制 的 结果 是 j 的 值 为 $1.25。 下 面 的 几 行 代码 是 输出 h、g 和 j 的 值 。 其 余 的 几 行 代码 是 自明 的 。 


程序 1-18 类 currency 的 应 用 


#include <iostream> 
#inciude "currency.h" 


using namespace std; 


int main() 
{ 
Urreney ; (EIUusy 3 S50)s Ty 


/使 用 两 种 形式 的 setValue 来 赋值 
g.setValue (minus, 2, 25); 
i.setVvalue(-6.45); 


/ 调用 成 员 函 数 add 和 output 
3 = hadatyg), 
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h.output (); 

这 关于 

goutput (); 

oOout << VW = Wy 
.OpUty: Cout < End 


/连续 调用 两 次 成 员 函 数 add 
j = i.add(g) .add(h); 


/省 略 了 输出 语句 
// 调用 成 员 函 数 increment 和 addq 
j = i.increment (g) .add (hn); 
// 省 略 了 输出 语句 
/ 测试 异常 


cout << "Attempting to initialize with cents = 152" << endl; 
try {i.setValue (plus, 3, 152);} 
catch (illegalParameterValue e) 


{ 
cout << "Caught thrown exception" << endl; 
e.outputMessage (); 


} 


return 0; 


1.5.2 一 种 不 同 的 描述 方法 


假设 已 经 有 许多 应 用 程序 采用 了 程序 1-13 的 currency 类 ， 现 在 我 们 想 要 修改 对 currency 
类 对 象 的 数据 描述 ， 使 应 用 最 多 的 两 个 成 员 函 数 add 和 increment 运行 更 快 ， 进 而 提高 应 用 程 
序 的 执行 速度 。 因 为 用 户 仅仅 通过 公有 部 分 所 提供 的 接口 与 currency 类 进行 交互 ， 所 以 对 私 
有 部 分 的 修改 不 会 影响 应 用 程序 的 正确 性 。 因 此 ， 私 有 部 分 修改 ， 而 应 用 程序 不 用 修改 。 

新 的 描述 仅 有 一 个 私有 数据 成 员 ， 类 型 为 long。 数 132 代表 $1.32， 而 -20 代表 -$0.20。 
程序 1-19、 程 序 1-20、 程 序 1-21 是 currency 类 的 新 声明 以 及 各 成 员 函 数 的 实现 。 

注意 ， 如 果 把 新 代码 放 在 文件 currencyh 中 ,程序 1-18 的 代码 依然 可 以 执行 ， 而 不 需要 
任何 修改 。 对 用 户 隐 藏 类 的 实现 细节 的 一 个 重大 的 益处 是 ， 用 新 的 、 更 高 效 的 类 对 象 描 述 取 
代 以 前 的 描述 之 后 ， 应 用 代码 不 需要 任何 改动 。 


程序 1-19 类 currency 的 新 声明 
class currency 
{ 
pubiice: 
1/ 构造 函数 
currency (signType theSign = plus, 
unsigned long theDollars = 0， 
unsigned int theCents = 0); 
// 析 构 函数 
~currency() {} 
void setValue (signType, unsigned long, unsigned int); 
void setValue (double); 
signType getSign() const 
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{if (amount < 0) return minus; 
else return plus;} 
unsigned long getDollars() const 
{if (amount < 0) return (-amount) / 100; 
else return amount / 100;} 
unsigned int getCents() const 
{if (amount < 0) return -amount - getDollars() * 100; 
else return amount - getDollars() * 100;} 
currency add(const currency&) const; 
currency& increment (const currencyg& x) 
{amount += x.amount; return *this;} 
void output () const; 
private: 
long amount; 


程序 1-20 ”构造 函数 和 成 员 函 数 setValue 的 新 代码 


currency: :currency (signType theSign，unsigned long theDollars, 
unsigned int theCents) 
{1/ 创建 一 个 currency 类 对 象 
setValue (theSign, theDollars, theCents); 


void currency::setValue (signType thesign, unsigned long theDollars, 
unsigned int theCents) 


{// 给 调用 对 象 赋值 
if (theCents > 99) 
1/ 美 分 值 太 大 


throw illegalParameterValue ("Cents should be < 100"); 


amount = theDollars * 100 + theCents; 
If (theSign == minus) amount = -amount; 


void currency::setValue (double theAmount) 


{VW 给 调用 对 象 赋值 
if (theAmount < 0) 
amount = (long) ((theAmount - 0.001) * 100);，; 
else 
amount = (long) ((theAmount + 0.001) * 100); 
1 取 两 个 十 位 数 


程序 1-21 成 员 函 数 add 和 output 的 新 代码 


currency currency::add(const currency& X) const 
{WN 把 x 和 *this 相 加 

currency y; 

y.amount = amount + x.amount; 

return y; 


void currency::output() const 


{1/ 输出 调用 对 象 的 值 


19 





20 锚 一 六 分 天 备 知 形 





jong theAmount = amount; 
EE ‘(theAmount < 0) {eout << (一 1 
theAmount = -theAmount;} 
long dollars = theAmount / 100; 1/ 美元 
GOUNE < $9. Xe Hollars < "ss 
int cents = theAmount - dollars * 100; 1/ 美 分 
if (cents < 10) cout << '0'; 
cout << cents; 


1.5.3 ”操作 符 重 载 


类 currency 有 若干 个 成 员 函 数 与 Ct+ 标 准 操作 符 类 似 。 例 如 ,add 实 施 的 是 + 操 
作 ，increment 实施 的 是 += 操 作 。 使 用 这 些 标准 的 C++ 操作 符 比 定义 新 的 诸如 add 和 
increment 的 成 员 函 数 要 自然 得 多 。 为 了 使 用 操作 符 + 和 +=， 我 们 进行 操作 符 重 载 ( operator 
overloading )， 它 可 以 扩大 C++ 操作 符 的 应 用 范围 ， 使 其 操作 新 的 数据 类 型 或 类 。 

程序 1-22 的 类 声明 分 别 用 操作 符 + 和 += 替代 了 add 和 increment。 成 员 函 数 output 用 一 
个 输出 流 的 名 字 作 为 参数 。 程 序 1-23 给 出 了 add 和 output 的 新 代码 ， 以 及 重 载 的 C++ 流 搬 和 人 
操作 符 << 的 代码 。 

注意 ,我 们 重 载 流 插 和 人 操作 符 ， 但 没有 把 它 声明 为 类 的 成 员 函 数 ， 而 是 把 重 载 的 + 和 += 
声明 为 类 的 成 员 函 数 。 同 样 ， 我 们 也 可 以 重 载 流 提 取 操 作 符 >>， 而 没有 把 它 声 明 为 类 的 成 员 
函数 。 还 要 注意 ， 使 用 成 员 函 数 output 有 助 于 对 流 插入 操作 符 << 的 重 载 。 因 为 非 成 员 函 数 
不 能 访问 currency 对 象 的 私有 成 员 ( 重 载 的 << 不 是 成 员 函 数 ， 而 重 载 的 + 是 )， 所 以 重 载 << 
的 代码 不 能 直接 引用 要 插入 到 输出 流 的 对 象 x 的 私有 成 员 。 例 如 ， 下 面 的 代码 是 错误 的 ， 因 
为 它 访问 了 不 该 访问 的 私有 数据 成 员 amount。 


// 重 载 << 
Ostream& operator<<(ostream& out , const currency& x) 
{out<< x.amount; return out;} 


程序 1-22 ”包含 操作 符 重 载 的 类 声明 


class currency 
{ 
public: 
1/ 构造 函数 
currency (signType theSign = Plus， 
unsigned long theDollars = 0, 
unsigned int theCents = 0); 
1/ 析 构 函数 
~currency() 1{} 
void setValue (signType, unsigned long, unsigned int); 
void setValue (double); 
signType getSign() const 
{if (amount < 0) return minus; 
else return plus;} 
unsigned long getDollars() const 
{if (amount < 0) return (~-~amount) / 100; 
else return amount / 100;} 
unsigned int getCents () const 





{if (amount < 0) return -amount ~ getDollars() * 100; 
else return amount - getDollars() * 100;1 

currency operator+(const currency&) const; 

currency& operator+=(const currencyé& x) 
{amount += x.amount; return *this;} 

void output (ostream&) const} 

private: 
long amount; 


程序 1-23 +、output 和 << 的 代码 
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currency currency: :operatort{const currency& x) const 


{// 把 参数 对 象 x 和 调用 对 象 *this 相 加 
Currency result; 
result.amount = amount + x.amount; 
return result; 


void currency::output (ostream& out) const 
{1/ 把 货币 值 插入 流 out 
long theAmount = amount; 
if (theAmount < 0) {out << '-'}; 
theAmount = -theAmount;} 
long dollars = theAmount / 100; 1/ 美元 
Ut & "$' < Ollears < sR 
int cents = theAmount - dollars * 100; /1/ 美 分 
i (Cents < 10) out < ‘O01 
Out << cents; 


// 重 载 << 
Ostream& coPerator<< (csttream& out, Const CuUrrencyg& x) 
1 GULPUt (Gut); Teturn aout} 


假设 操作 符 已 经 重 载 ， 而 且 程 序 1-22 和 程序 1-23 的 代码 包含 在 文件 currenyOverload.h 


中 ， 于 是 就 有 了 程序 1-24， 它 是 程序 1-18 的 另 一 个 版 本 。 
程序 1-24 ”使 用 重 载 操作 符 


#include <iostream> 
#include "currencyOverload.h" 


using namespace std; 


int main () 
{ 
SUrESNEY 可 《RS 3 SSO), i, 林产 


/ 使 用 两 种 形式 的 setValue 来 赋值 
gsetValue (minuss 2 25); 
i.setValue (-6.45);，; 


// 调用 成 员 函 数 add 和 output 
j=h+g; 
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/连续 两 次 调用 成 员 函 数 ada 

二 1 

Bout 让 生 人 风机 
< 本 AS 


// 调用 成 员 函 数 increment 和 add 
out Te "Inerement " x 1 KE VW by " < 'g 
<< " and then add " << h << endl; 
了 二 人 FE) 志和 
cout << "Result is "<< j << endl; 
cout << "Incremented object is " << i << endl; 


/ 测试 异常 

cout << "Attempting to initialize with cents = 152" << endl; 

try {i.setVvalue (plus, 3, 152);} 

catch (illegalParameterValue e) 

{ 
cout << "Caught thrown exception" << endl; 
e.outputMessage () >” 

} 


return 0; 


1.5.4” 友 元 和 保护 性 类 成 员 


正如 前 面 所 指出 的 那样 ， 对 一 个 类 的 私有 成 员 ， 仅 有 类 的 成 员 函 数 才能 直接 访问 。 可 是 
在 一 些 应 用 程序 中 ， 我 们 必须 给 予 别 的 类 和 函数 直接 访问 该 类 私有 成 员 的 权利 。 这 就 需要 把 
这 些 类 和 栗 数 声明 为 该 类 的 友 元 (friend )。 

在 currency 类 的 示例 中 ( 见 程序 1-22 )， 为 了 便于 对 操作 符 << 的 重 载 ， 我 们 定义 了 成 员 
函数 output。 通 过 output， 下面 的 函数 才能 访问 私有 数据 成 员 amount。 


ostream& operator<<(ostream&k,const currencyg) 


如 果 把 ostream& operator<< 声 明 为 currency 类 的 友 元 ， 它 就 可 以 直接 访问 currency 类 的 所 
有 成 员 ( 私有 和 公有 )， 这 时 也 就 不 用 另外 定义 成 员 函 数 output 了 。 为 了 建立 友 元 ， 我 们 在 
currency 类 的 描述 中 引入 friend 语句 。 为 了 格式 统一 ，friend 语句 总 是 紧 跟 在 类 标题 语句 之 
后 ， 如 : 


class currencyl! 
friend ostream& operator<<(ostream&, const Currency&); 
public: 


有 了 友 元 声明 ， 就 可 以 使 用 程序 1-25 的 代码 来 重 载 操作 符 <<。 当 currency 的 私有 成 员 发 生 
变化 时 ， 必 须 检查 currency 的 友 元 ， 并 做 出 相应 的 修改 。 


程序 1-25 ” 重 载 友 元 操作 符 << 
// 重 载 << 


Ostreamg& operator<<(ostream& out, const currencyg& x) 
{// 把 货币 值 插入 流 out 


long theAmount = x.amount; 
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if (theAmount < 0) {out << '-'; 


theAmount = -theAmount;} 
long dollars = theAmount / 100; 1/ 美元 
Out < I" KX, dOLLALES < Ts' 
int cents = theAmount - dollars * 100; 1/ 美 分 


it (cents < 10) out << '0O'; 
Out <<, Centsy 
return out7 


} 


一 个 类 A 从 另 一 个 类 B 派生 ，A 是 派生 类 ( derived class )，B 是 基 类 (base class )。 派 
生 类 需要 访问 基 类 的 部 分 或 所 有 数据 成 员 ， 为 此 ，C++ 提供 了 第 三 类 成 员 一 一 保护 性 成 员 
( protected )。 保 护 性 成 员 类 似 于 私有 成 员 ， 区 别 在 于 派生 类 函数 可 以 访问 基 类 的 保护 性 成 员 。 

用 户 应 用 程序 可 以 访问 的 类 成 员 应 该 是 公有 的 。 数 据 成 员 永远 不 要 出 现在 公有 部 分 , 但 
是 它们 可 以 定义 为 保护 性 成 员 或 私有 成 员 。 优 秀 的 软件 工程 设计 原则 要 求 数 据 成 员 是 私有 的 。 
通过 成 员 函 数 ， 派 生 类 可 以 间接 访问 基 类 的 私有 数据 成 员 ， 同 时 ， 修 改 基 类 的 实现 代码 时 不 
用 修改 它 的 派生 类 。 


1.5.5 ”增加 ##fndef、#define 和 #endif 语句 


文件 currency.h ( 或 currencyOverload.h ) 包含 了 currency 类 的 声明 和 实现 细节 。 在 文件 
头 ， 应 该 加 上 语句 


#ifndef Currency 
#define Currency 


在 文件 尾 加 上 语句 


#endif 


包含 在 这 组 语句 之 内 的 代码 只 编译 一 次 。 建 议 你 为 本 书 所 提供 的 其 他 类 定义 也 加 上 相应 
的 语句 。 


练习 


15. 1 ) 假设 无 符号 长 整 型 、 无 符号 整 型 都 占用 4 字 节 (所 以 这 些 类 型 的 对 象 范围 是 0 ~ 
2”-1 )， 那 么 在 程序 1-13 中 ， 可 容许 的 货币 最 大 和 最 小 值 是 多 少 ? 
2 ) 在 程序 1-13 中 ， 假 设 美元 和 美 分 都 改 为 整 型 ， 那 么 可 容许 的 货币 最 大 和 最 小 值 是 
多 少 ? 
3 ) 在 程序 1-16 的 add 中 ， 为 了 确保 从 currency 类 型 转换 成 long int 类 型 时 不 会 发 生 错 误 ， 
al 和 a2 最 大 可 能 的 值 应 该 是 多 少 ? 
16. 扩展 程序 1-13 的 类 currency， 添 加 下 列 成 员 函 数 : 
1 ) inputO 从 标准 输入 流 中 读 取 currency 的 值 ， 然 后 赋 给 调用 对 象 。 
2 ) subtract(x) 从 调用 对 象 中 减 去 参数 对 象 x 的 值 ， 然 后 返回 结果 。 
3 ) percent(x) 返回 一 个 currency 类 的 对 象 ， 它 的 值 是 调用 对 象 的 x%。x 的 数据 类 型 为 
double. 
4 ) multiply(x) 返回 一 个 currency 类 的 对 象 ， 它 的 值 是 调用 对 象 和 double 型 数 x 的 乘积 。 
5 ) divide(x) 返回 一 个 currency 类 的 对 象 ， 它 的 值 是 调用 对 象 除 以 double 型 数 x 的 结果 。 


24 务 一 部 分 现 备 知 厌 





实现 所 有 成 员 函 数 ， 用 适当 的 数据 检验 它们 的 正确 性 。 
17. 使 用 程序 1-19 的 代码 完成 练习 16。 
18. 1 ) 使 用 程序 1-22 完成 练习 16。 重 载 >>、-、%、* 和 /。 当 重 载 >> 时 ,将 其 声明 为 友 元 
函数 ， 不 要 定义 公有 输入 函数 来 支持 输入 操作 。 
2 ) 重 载 赋值 操作 符 = 替代 成 员 函 数 setValue。 形 式 为 operator=(int x) 的 重 载 ， 把 一 个 整数 
赋 给 一 个 currency 类 的 对 象 ， 它 替代 了 具有 三 个 参数 的 成 员 函 数 setValue，x 把 符号 、 
美元 和 美 分 都 集中 在 一 个 整数 里 。 形 式 为 operator=(double x) 的 重 载 ， 蔡 代 的 是 仅 有 一 
个 参数 的 成 员 函 数 setValue。 


1.6 ”异常 类 illegalParameterValue 


程序 1-26 是 一 个 用 户 定义 的 类 illegalParameterValue。 当 一 个 函数 的 实 参 值 无 意义 时 ， 要 
抛 出 的 异常 就 是 这 个 类 型 。 程 序 1-27 是 程序 1-8 的 另 一 个 版 本 ， 程 序 1-27 抛 出 的 异常 类 型 
是 illegalParameterValue， 而 程序 1-8 抛 出 的 异常 类 型 是 char*。 程 序 1-28 显示 的 是 如 何 捕捉 
illegalParameterValue 类 型 的 异常 。 





程序 1-26 ”定义 一 个 异常 类 
class illegalParameterValue 


{ 





Bublies 
illegalParameterValue(): 
message ("Illegal parameter value"){} 
illegalParameterValue (char* theMessage) 
{message = theMessage;} 
void outputMessage() {cout << message << endl;} 
Private: 
string message; 


程序 1-27” 抛 出 ilegalParameterValue 类 型 的 异常 


int abcl(lint a, int b, int c) 
{ 
if (a <= 0 ||b<=0 || c <= 0) 
throw illegalParameterValue ("All parameters should be > 0") 
DER + BC) 


程序 1-28 捕捉 ilegalParameterValue 类 型 的 异常 





int main() 
{ 
try {cout << abce(2;,0;4) << endl;} 
catch (illegalParameterValue e) 
{ 
cout << "The parameters to abc were 2, 0, and 4" << endl; 
cout << "illegalParameterValue exception thrown" << endl; 
e.outputMessage (); 
return 1;} 
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return 0; 








1.7 递归 函数 


递归 函数 (recursive function ) 或 方法 自己 调用 自己 。 在 直接 递归 ( direct recursion ) 中 ， 
递归 函数 f 的 代码 包含 了 调用 的 语句 ， 而 在 间接 递归 (indirect recursion ) 中 ,递归 函数 f 调 
用 了 函数 g，g 又 调用 了 函数 h， 如 此 进行 下 去 ， 直 至 又 调用 了 f。 在 深入 探讨 C++ 递归 琐 数 
之 前 ， 我 们 来 考察 两 个 相关 的 数学 概念 一 一 数学 函数 的 递归 定义 和 归纳 证 明 。 


1.7.1 递归 的 数学 函数 
数学 中 经 常 有 这 样 的 函数 ， 它 自己 定义 自己 。 例 如 ，n 的 阶乘 函数 fn)=n!，n 为 整数 : 


nl 
A) = a 1) m2> 1 
当 小 于 或 等 于 1 时 , f(n) 的 值 为 1， 例如 f(-3) = 了 (0) =f(1) = 1。 当 nn 大 于 1 时 , f(n) 
是 递归 定义 的 ， 因 为 右 侧 也 有 J 但 这 不 会 导致 循环 定义 ， 因 为 右 侧 f 的 参数 小 于 左 侧 f 的 参 
数 。 例 如 ，f(2) = 2f(1)， 因 为 f(1)=1， 所 以 f(2) = 2*1 =2， 以 此 类 推 ,7f(3) = 3/(2) = 3*2 = 6。 
假定 f(tn) 是 直接 递归 的 。 要 使 函数 fln) 的 递归 定义 有 一 个 完全 的 形式 ， 需 要 满足 如 下 条 件 : 
e。 有 一 个 基础 部 分 (base component )， 它 包含 的 一 个 或 多 个 值 ， 对 这 些 值 ，/f(n) 是 直 
接 定义 的 ( 即 不 用 递归 就 能 求解 )。 为 简单 起 见 ， 我 们 假定 ,8 的 定义 域 是 非 负 整数 ， 基 
础 部 分 包含 0 夺 n 三 k， 其 路 为 非 负 常 数 。(n 三 的 情形 也 是 可 能 的 ， 但 很 少见 。) 
e 在 递归 部 分 (recursive component )， 右 侧 有 一 个 参数 小 于 n， 因 此 重复 应 用 递归 部 分 
可 以 把 右 侧 f 的 表达 式 转变 为 基础 部 分 。 
在 公式 (1-1) 中 ， 基 础 部 分 是 f(n)=1, n<1; pe ed 右 侧 了 的 参数 
是 n-1， 比 mn 小。 重复 应 用 递归 部 分 将 了 (n-1) 转变 为 f(n-2), f(n-3)，…， 直 到 f(1)， 而 f(1) 
属于 基础 部 分 。 例 如 : 





1 








f(5)= 5f(4) = 20/(3) = 607(2) = 120/(1) 
注意 ， 递 归 部 分 的 每 一 次 应 用 都 使 我 们 更 接近 基础 部 分 。 最 后 应 用 基础 部 分 ， 我们 得 到 
7(5)=120。 从 这 个 例子 中 我 们 看 到 的 是 f(n) = n(n-1)(n-2)…1 (7 三 1)。 
递归 定义 的 另 一 个 例子 是 斐 波 那 契 数 列 : 
Fo=0, Fi=1, Fr= Pri Fry (1 ) (1-2) 
其 中 fo= 1 和 下 = 1 是 基础 部 分 ，F, = Fi+ Fz 是 递归 部 分 。 右 侧 的 函数 参数 比 n 小 。 要 使 
公式 (1-2 ) 成 为 完全 递归 形式 ， 从 n>1 开始 反复 应 用 递归 部 分 ， 每 次 n 的 值 都 要 减 去 1 或 2， 
最 终 将 右 侧 的 表达 式 转 化 为 基础 部 分 的 表达 式 。 例 如 ，F4=Fy+F2=FytFi+Fi+Fo=3Fi+2Fo0=3。 





1.7.2 ”归纳 


现在 我 们 把 注意 力 转移 到 与 递归 函数 有 关 的 第 二 个 概念 一 一 归纳 证 明 。 在 一 个 归纳 证 明 
中 ,我 们 要 证 明 下 列 公式 成 立 


Yi=n(n+1)/2 n>0 (1-3) 
i=0 
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证 明 的 方法 是 ， 首 先 检验 ， 对 n 的 一 个 或 多 个 基础 值 (一 般 n=0 就 可 以 )， 公 式 成 立 ; 
然后 假设 当 n 从 0 到 m 时 公式 成 立 ， 其 中 mm 是 任意 一 个 大 于 或 等 于 最 大 基础 值 的 整数 。 最 
后 ,根据 这 个 假设 证 明 ， 当 n 等 于 m+l 时 公式 成 立 。 这 种 证 明 方 法 有 三 个 部 分 一 一 归纳 基础 
(induction base )、 归 纳 假 设 (induction hypothesis ) 和 归纳 步骤 ( induction step )。 

下 面 归纳 证 明 公式 (1-3 )。 在 归纳 基础 部 分 ， 我们 可 以 检验 ， 当 n=0 时 公式 成 立 。 在 
归纳 假设 部 分 ,假定 当 n < m 时 公式 成 立 ， 其 中 m 是 任意 大 于 或 等 于 0 的 整数 ( 假定 n=m 


时 公式 成 立 亦 可 )。 在 归纳 步骤 阶段 ， 要 证 明 当 n=m+1 时 公式 成 立 。 从 归纳 假设 可 知 Zi 
m(m+1)2 成 立 ， 因 此 2 =m+l+ > =m +1+m(m+1)/2=(m+1)(m+2)Y2， 即 公式 (1-3) 成 立 。 


乍 看 起 来 ， 归纳 证 明 好 像 是 一 个 循环 证 明 一 因为 我 们 给 出 的 是 一 个 假设 为 正确 的 结论 ， 
其 实 不 然 。 就 像 递归 定义 并 不 是 循环 定义 一 样 。 每 一 个 正确 的 归纳 证 明 都 有 一 个 归纳 基础 部 
分 ， 它 与 递归 定义 的 基础 部 分 相似 。 归 纳 步 又 使 用 的 是 在 归纳 基础 部 分 已 经 检验 的 正确 结果 。 
反复 应 用 归纳 步骤 ， 把 证 明 部 分 转化 为 基础 部 分 所 具有 的 形式 。 


1.7.3 C++ 递归 函数 


使 用 C++ 可 以 编写 递归 困 数 。 正 确 的 递归 函数 必须 包含 基础 部 分 。 每 一 次 递归 调 
用 ， 其 参数 值 都 比 上 一 次 的 参数 值 要 小 ， 从 耐量 党 负 者 过 明证 娄 抄 数 才 信 这 到 半 而 分 
的 值 。 

例 1-1[ 阶乘 ] 程序 1-29 是 一 个 C++ 递归 函数 ， 它 利用 公式 (1-1 ) 来 计算 阶乘 n!。 基 础 
部 分 是 n < 1。 考 虑 factorial(2) 的 计算 过 程 。 为 了 计算 在 else 语句 中 的 表达 式 2*factorial(1)， 
将 factorial(2) 的 计算 挂 起 ， 然 后 调用 factorial(1)。 当 factorial(2) 的 计算 被 挂 起 时 ， 程 序 状 
态 ( 即 局 部 变量 和 传 值 形 参 的 值 、 与 引用 形 参 绑 定 的 值 、 代 码 执行 位 置 等 ) 被 保留 在 递归 栈 
中 。 当 factorial(1) 的 计算 结束 时 ， 程 序 状态 恢复 。factorial(1) 的 返回 值 是 1。 接 下 来 继续 计算 
factorial(2)， 即 计算 2*1。 国 


程序 1-29 计算 nl 的 递归 函数 





imnt factorial'(int n) 
{// 计算 nl 
if (nn <= 1) return 1; 
else return n * factorial(n - 1);} 


} 


在 计算 factorial(3) 时 ， 遇 到 else 语句 ，factorial(3) 的 计算 被 挂 起 ， 先 计算 出 factorial(2)。 我 
们 已 经 知道 factorial(2) 的 计算 过 程 ， 其 结果 为 2。 当 factorial(2) 返回 时 ，factorial(3) 的 计算 继 
续 ， 计 算 的 是 3*2。 

因为 程序 1-29 与 公式 (1-D 相似 ， 所 以 它们 的 正确 性 是 等 价 的 。 

例 1-2 模板 函数 sum (程序 1-30 ) 对 数组 元 素 a[0] 至 an-1] ( 简 记 为 a[0:n-1] ) 求 和 。 
当 n=0 时 ， 函 数 返回 值 是 0。 


程序 1-30 ”累加 数组 元 素 a[0:n-1] 





template<class T> 
T sum(T al[l], int n) 
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{// 返回 数值 数组 元 素 a[0:n-1] 的 和 
T theSum = 0; 
Ee “(i 97 二 证 
theSum += alil; 
return theSum; 


} 


程序 1-31 是 对 数组 元 素 af0:n-1] 求 和 的 递归 函数 。 当 n 等 于 0 时 ， 和 为 0; 当 n 大 于 0 
时 ，n 个 元 素 的 和 是 前 n-1 个 元 素 的 和 加 上 最 后 一 个 元 素 。 


程序 1-31 累加 数组 元 素 a[0:n-1] 的 递归 代码 





template<class T> 
T rsSum(T a{l]; int n) 
{// 返回 数组 元 素 a[0:n-1] 的 和 
i (OY 
return roumi(ay n=1) ~ 本 上 车 =1 7 
return 0; 


加 

例 1-3[ 排列 ] 我 们 常常 要 从 个 不 同 元 素 的 所 有 排列 中 确定 一 个 最 佳 的 排列 。 例 如 ，a、 
b 和 cc 的 排列 有 abc、acb 、bac、bca、cba 和 cab。nn 个 元 素 的 排列 个 数 是 n!。 

为 输出 个 元 素 的 所 有 排列 ， 编 写 非 递归 的 C++ 函数 比较 困难 ,但 是 编写 递归 函数 就 
不 那么 困难 了 。 设 E={e1，…，ew} 是 nn 个 元 素 的 集合 ,， 求 5 的 元 素 的 所 有 排列 。 令 Ei 表示 
从 EE 中 去 除 第 i 个 元 素 ei 以 后 的 集合 ,， 令 perm(X) 表示 集合 了 的 元 素 所 组 成 的 所 有 排列 ， 仿 
eiperm(X) 表示 在 perm(X) 中 的 每 个 排列 加 上 前 级 ej; 之 后 的 排列 表 。 例 如 ，E={a,， b,c}， 
El={b, c}, perm(Ei)=(bec, cb), ei.perm(E1)=(abc, acb)。 

当 wn=1 时 ， 是 递归 基础 部 分 。 这 时 的 集合 E 只 有 一 个 元 素 e， 因此 只 有 一 个 排列 : 
perm(E)=(e)。 当 n>1 时, perm() 是 一 个 表 : ei.perm(E1), es.perm(E;), es.perm(E;)，…， 
en.perm(E,)。 这 个 定义 是 用 n 个 集合 perm(X) 来 定义 集合 perm(5)， 其 中 每 个 包含 n-1 个 元 
素 ， 它 成 为 递归 步骤 。 既 有 基础 部 分 ， 又 有 递归 部 分 ， 这 是 一 个 完整 的 递归 定义 。 

根据 上 述 递 归 定 义 ， 当 n=3 且 E=(a, b，c) 时 ， 有 perm(B)=a.perm({b,c}),b.perm( {a,c}),c. 
perm({b,a})。 同 样 ，perm({b,c})=b.perm({c}),c.perm({b})。 因 此 ，a.perm({b,c})=ab.perm({c}),ac. 
perm({b})=ab.c,ac.b=(abc，acb)。 同 理 ，b.perm({a,c})=ba.perm({c}),bc.perm( {a})=ba.c,bc.a=(bac,bca) 
Hc.perm({b, a })=cb.perm( {a}),ca.perm({b})= cb.a,ca.b= (cba,cab)。 因 此 perm(E£)=(abc,acb,bac,bca,cba, 
cab)。 

注意 ，a.perm({b,c}) 实际 上 是 两 个 排列 : abe 和 acb， 其 中 a 是 它们 的 前 缀 ，perm({fb,c)) 
是 它们 的 后 级 。 同 样 ，ac.perm({b}) 表示 前 缀 为 age、 后 缀 为 perm({b}) 的 排列 。 

程序 1-32 把 上 述 perm(B) 的 递归 定义 转变 成 一 个 C++ 函数 。 这 个 函数 输出 的 排列 具有 如 
下 特征 : 其 前 级 为 list[0:k-1]， 后 级 为 list[k:m]。 调 用 permutations(list,0,n-1)， 输 出 list[0:n-1] 
的 所 有 nl! 个 排列 。 在 这 个 调用 中 ，k=0，m=n-1。 这 时 输出 的 排列 是 前 级 为 空 、 后 缀 为 
list[0:n-1] 的 排列 。 当 k=m 时 ， 仅 有 一 个 后 缀 list[rm]， 这 时 输出 的 仅 是 一 个 排列 list[0:m]。 当 
k<m 时 ， 执 行 else 语句 。 令 EE 表示 list[k:m] 的 所 有 元 素 ,，E; 表 示 从 中 去 除 元 素 ej=list[i] 
之 后 的 集合 。for 循环 的 第 一 个 swap 把 ex: 和 e; 交 换 ， 即 list[k] = e;，list[i] = er。 然后 调用 
permutations 计算 ej.perm(E,)。 第 二 个 swap 把 list[k:m] 恢复 到 第 一 个 swap 调用 之 前 的 状态 。 


程序 1-32 ”使 用 递归 函数 生成 排列 


template<class T> 
void Permutations (T list[], int k, int m) 
{1/ 生成 1ist[k:m] 的 所 有 排列 
if (k == m) {//1list[k:m] 仅 有 一 个 排列 ,输出 它 
copy (list, list+mt+l, 
ostream iterator<T>(cout, "")); 
cout << endl; 
} 
else /Wl1ist[k:m] 有 多 于 一 个 的 排列 ， 递 归 地 生成 这 些 排列 
for (int i = k; i <= m; i++) 
{ 
swap (list[k], list[i]); 
permutations (list, k+l1, m); 
swap (list[k], list[i]}); 


} 


图 1-3 显示 了 程序 1-32 的 处 理 过程 ， 其 中 k=0，m=2，list[0:2]=[a,b,c]。 图 1-3 显示 
的 是 每 一 次 调用 permutations 之 后 以 及 第 二 次 调用 swap 之 后 的 list[0:2] 的 布局 。 无 阴影 音 
分 表示 list[0:k-1]， 阴 影 部 分 表示 list[k:m]。 数 组 外 的 数字 是 布局 的 编号 。 在 执行 
permutations(list,0,2) 的 过 程 中 ， 图 的 
每 一 条 边 都 经 过 两 次 : 一 次 是 在 for 循 
环 中 调用 函数 permutations， 另 一 次 是 从 
函数 permutations 返回 。 

从 布局 1 开始 。for 循 环 的 第 一 
个 swap 调 用 (swapllist[0],lint[0]) ) 对 
数组 没有 改变 ; 布局 2 是 在 for 循 图 1-3 生成 abe 的 所 有 排列 
环 中 调用 permutations 之 后 (permutations(lint,1,2) ) 的 数组 状态 。 从 布局 2 走 到 布局 3 
( swap(list[1],list[1])，permutations(list,2,2) )， 即 排列 abc 被 输出 ， 因 为 k=m。 输 出 布局 3 
之 后 返回 ， 然 后 执行 for 循环 的 第 二 个 swap 语句 ,结果 是 回 到 布局 2。 从 布局 2 走 到 布局 
4， 排 列 acb 被 输出 。 然 后 往 上 返回 直到 又 可 以 继续 。 我 们 回 到 布局 2， 然 后 回 到 布局 1。 
从 布局 1 我 们 走 到 布局 5 和 布局 6。 整 个 过 程 经 历 的 布局 顺序 是 1,2,3,2,4,2,1,5,6,5,7,5,1,8,9， 
8,10,8,1。 国 














练习 


19. 编写 非 递归 程序 计算 n!。 测试 你 的 代码 。 
20. 1 ) 编写 递归 函数 计算 翡 波 那 契 数 (Fibonacci ) F。 测 试 你 的 代码 。 
2 ) 证 明 对 于 1 ) 中 编写 的 代码 ， 当 计算 F, 且 n>2 时 ，Fi 的 计算 多 于 一 次 。 
3 ) 编写 非 递 归 函 数 计算 斐 波 那 契 数 (Fibonacci ) F,。 对 每 一 个 韭 波 那 契 数 ， 你 的 代码 应 
该 只 计算 一 次 。 测 试 你 的 代码 。 
21. 考察 在 下 面 的 公式 ( 1-4 ) 中 定义 的 函数 ,人 其 中 了 是 非 负 整数 。 


_ [m2 n 是 偶数 
fn) Rad (1-4) 
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22. 


2 


ny 


2 
2 


nn 


26. 


1 ) 使 用 公式 ( 1-4 ) 手 算 f(5) 和 f(7)。 
2 ) 确定 函数 的 基础 部 分 和 递归 部 分 。 证 明 重 复 应 用 递归 部 分 可 以 把 等 式 右 侧 的 了 表达 式 
转 为 基础 部 分 。 
3 ) 编写 一 个 C++ 递归 函数 计算 ,AD)。 测 试 你 的 代码 。 
4 ) 使 用 2) 的 证 明 编写 C++ 非 递 归 函 数 计算 ,/a) ， 不 能 使 用 循环 。 测 试 你 的 代码 。 
[ 阿 克 曼 函数 (Ackermann's Function )] 公式 (1-5 ) 定义 的 是 阿 克 曙 函数。 其中, i 和 j 
是 大 于 等 于 1 的 整数 。 
2/ i= 1 和 />1 
A(ij) =14(i- 1,2) i 之 2 和 j=1 (1-5 ) 
A(i-1.4A(ij- 1) ij 之 2 
1 ) 使 用 公式 (1-5 ) 手 算 4(1,2)、4(2,1) 和 4(2,2)。 
2 ) 确定 函数 定义 中 的 基础 部 分 和 递归 部 分 。 
3 ) 编写 C++ 递归 函数 计算 4( 疙 。 测 试 你 的 代码 。 


.[ 最 大 公约 数 (Greatest Common Divisor, GCD ) ] 当 两 个 非 负 整数 x 和 yy 都 是 0 的 时 候 ， 


它们 的 最 大 公约 数 是 0。 当 两 者 至 少 有 一 个 不 是 0 的 时 候 ， 它 们 的 最 大 公约 数 是 可 以 除 
尽 二 者 的 最 大 整数 。 因 此 ，gcd(0,0)=0，gcd(10,0)=gcd(0,10)=10， 而 gcd(20,30)=10。 求 最 
大 公约 数 的 欧 几 里 得 算法 ( Euclid's Algorithm ) 是 一 个 递归 算法 ， 据 说 出 现在 公元 前 375 
年 ， 或 许 是 最 早 的 递归 算法 实例 。 它 的 定义 由 下 面 的 公式 (1-6 ) 给 出 

ged 0)) = et mod y) ot 1 
在 公式 (1-6 ) 中 , mod 是 模 数 运算 子 ( modulo operator )， 它 相当 于 C++ 的 求 余 操作 符 %。 
x mody 是 x/y 的 余数 。 
1 ) 用 公式 ( 1-6 ) 手工 计算 gcd(20,30) 和 gcd(112,42)。 
2 ) 确定 函数 定义 的 基础 部 分 和 递归 部 分 。 证 明 反 复 应 用 递归 部 分 可 以 把 公式 右 侧 的 gcd 

表达 式 转 变 为 基础 部 分 的 表达 式 。 

3 ) 编写 一 个 C++ 递归 函数 计算 gcd(x,y)。 测 试 你 的 代 体 。 


. 编写 一 个 递归 模板 函数 ， 确 定 元 素 x 是 否 属于 数组 a[0:n-1]。 
.[ 子 集 生成 方法 ( Subset Generation ) ] 编写 一 个 C+ 递归 函数 ， 输 出 个 元 素 的 所 有 子 


集 。 例 如 ， 三 元 素 集 {a,b,c} 的 子 集 是 {}( 空 集 ), {a}, {b}, {c}, {a,b}, {a,c}, {b,c}, {a,b,c}。 
这 些 子 集 用 0/1 组 成 的 代码 序列 来 表示 分 别 是 000, 100, 010, 001, 110, 101, 011, 111 (0 
表示 相应 的 元 素 不 在 子 集 中 ，1 表示 相应 的 元 素 在 子 集中 )。 因此， 你 的 程序 输出 长 度 为 n 
的 0/1 序列 即 可 。 

[格雷 码 (Gray Code ) ] 两 个 代码 之 间 的 海 明 距 离 ( Hamming distance ) 是 对 应 位 不 等 的 
数量 。 例 如 ，100 和 010 的 海 明 距 离 是 2。 一 个 ( 二进制 ) 格雷 码 是 一 个 代码 序列 ， 其 中 
任意 相 邻 的 两 个 代码 之 间 的 海 明 距 离 是 1。 练 习 25 的 三 位 代码 序列 不 是 格雷 码 。 而 三 位 
代码 序列 000, 100, 110, 010, 011, 111, 101, 001 是 格雷 码 。 这 个 代码 序列 也 有 一 个 特性 ， 第 
一 个 代码 和 最 后 一 个 代码 只 有 一 位 二 进 制 数 不 同 ， 即 海 明 距 离 是 1。 在 代码 序列 的 一 些 应 
用 中 ， 从 一 个 代码 到 下 一 个 代码 的 代价 取决 于 它们 的 海 明 距 离 。 因 此 我 们 希望 这 个 代码 序 
列 是 格雷 码 。 格 雷 码 可 以 用 代码 变化 的 位 置 序 列 简洁 地 表示 。 对 上 面 的 三 位 格雷 码 序列 ， 
这 个 位 置 序列 是 1, 2, 1, 3, 1, 2, 1。 令 g(n) 是 一 个 nn 元素 的 格雷 码 的 位 置 变化 序列 。 公 式 
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(1-7 ) 是 g(n) 的 递归 定义 。 


i | a CY 
2(n-1),n,e(n-1) n>1 
1 ) 使 用 公式 ( 1-6 ) 手 算 g(4)。 
2 ) 确定 函数 定义 的 基础 部 分 和 递归 部 分 。 证 明 反 复 应 用 递归 部 分 可 以 把 公式 右 侧 的 g 表 
达 式 转变 为 基础 部 分 的 表达 式 。 
3 ) 编写 一 个 C++ 递归 函数 计算 g(n)。 测试 你 的 代码 。 


1.8 标准 模板 库 


C++ 标准 模板 库 ( STL ) 是 一 个 容器 、 适 配器 、 和 迭代 器 、 函 数 对 象 ( 也 称 仿 函数 ) 和 算 
法 的 集合 。 有 效 使 用 STL， 应 用 程序 的 设计 会 简单 许多 。 本 书 首先 使 用 基本 的 C++ 语言 结构 
解决 一 个 问题 ， 以 说 明 求 解 问题 的 方法 。 然 后 利用 STL 说 明 如 何 用 更 简单 的 方法 解决 同样 的 
问题 。 

例 1-4[STL 算法 accumulate] STL 有 一 个 算法 accumulate 是 对 顺序 表 元 素 顺 序 累 计 求 
和 。 它 的 语法 是 


accumulate (start,end ,initialValue) 


其 中 start 指向 首 元 素 ，end 指向 尾 元 素 的 下 一 个 位 置 。 因 此 要 累计 求 和 的 元 素 范 围 是 [start， 
end)。 调 用 语句 是 


accumulate (aa+n ,initialValue) 
其 中 a 是 一 个 一 维 数组 。 返 回 值 是 
initialValue + a 
程序 1-33 利用 STL 算法 accumulate， 它 实现 了 与 程序 1-30 和 程序 1-31 一 样 的 功能 。 


程序 1-33 ”利用 STL 的 算法 accumulate 对 a[0:n-1] 求 和 


template<class T> 
T Sum(T alj;: Lnt n) 
{// 返回 数组 a[0:n-1] 的 累计 和 
T 七 heSum = 0; 
return accumulate(a, a+tn, theSum); 


} 


STL 的 算法 accumulate 利用 操作 符 ++， 从 start 开始 ， 到 end 结束 ， 相 继 访 问 要 累计 求 
和 的 顺序 表 元 素 。 因 此 ， 对 于 任意 一 个 序列 ， 如 果 它 的 元 素 可 以 通过 重复 应 用 操作 符 ++ 来访 
问 ， 那 么 就 可 以 用 这 个 算法 对 它 的 值 累 计 求 和 。 一 维 数组 和 STL 容器 vector 都 是 这 种 顺序 表 
实例 。 在 本 书后 面 还 有 其 他 类 似 的 例子 。 

STL 算法 accumulate 还 有 一 个 更 通用 的 形式 ,语法 如 下 : 


accumulate(start,end ,initialValue,operator) 


其 中 ，operator 是 一 个 函数 ， 它 规定 了 在 累计 过 程 中 的 操作 。 例 如 ， 利 用 STL 的 函数 对 象 
multiplies 能 够 计算 数组 元 素 的 乘积 ， 如 程序 1-34 所 示 。 








程序 1-34 ”计算 数组 元 素 a[0:n-1] 的 乘积 
template<class T> 
T produect(T a[l, int n) 
{1/ 返回 数组 a[0:n-1] 的 累计 和 
T theProduct = 1)， 
return accumulate(a, a+n, theProduct, multiplies<T>()); 


加 
例 1-5[STL 算法 copy 和 next_permutation] 算法 copy 把 一 个 顺序 表 的 元 素 从 一 个 位 置 
复制 到 另 一 个 位 置 。 语 法 是 


copy (start,end, to) 


其 中 to 给 出 了 第 一 个 元 素 要 复制 到 的 位 置 。 因 此 ， 元 素 从 位 置 start, startt+1,… ,end-1 依次 复 
制 到 位 置 to, to+1，:…，totend-start。 
算法 next_permutation， 其 语法 是 


next permutation(start,end) 


对 范围 [start,end) 内 的 元 素 ， 按 字典 顺序 ,产生 下 一 个 更 大 的 排列 。 当 且 仅 当 这 个 排列 存在 
时 ， 返 回 值 为 tue。 对 一 个 其 元 素 各 不 相同 的 顺序 表 ， 从 字典 顺序 最 小 的 一 个 排列 开始 ， 连 
续 调 用 next permutation， 可 以 得 到 所 有 的 排列 。 程 序 1-35 便 是 这 样 的 算法 。 该 程序 调用 
copy 将 元 素 list[0:m] 复制 到 输出 流 cout， 每 一 个 复制 的 元 素 都 跟着 一 个 空 串 ("" )。 如 果 初 
始 的 序列 是 字典 顺序 最 小 的 ， 那 么 程序 1-35 与 程序 1-32 等 价 。 注 意 ， 程 序 1-35 不 输出 按 字 
典 顺序 比 初始 序列 小 的 排列 ， 而 程序 1-32 输出 所 有 排列 ， 不 论 初始 序列 如 何 。 练 习 要 求 修改 
程序 1-35， 使 它 能 够 输出 所 有 排列 。 


程序 1-35 ”使 用 STL 算法 next_permutation 求 排列 


templatex<class T> 
void Permutations (T list[], int k, int m) 
{// 生成 1ist[k:m] 的 所 有 排列 
/假设 k 到 m 
1/ 将 排列 逐个 输出 
do 1 
copy (list, list+m+1, 
ostream iterator<T>(cout, "")); 
cout << endl; 
} while (next permutation(list, list+m+1)); 
} 


next_permutation 算法 具有 更 一 般 的 形式 ， 它 带 有 第 三 个 参数 compare， 如 下 所 示 : 


next permutation(start,end,compare) 


盟 数 compare 用 来 判定 一 个 排列 是 否 比 男 一 个 排列 要 小 。 而 在 仅 有 两 个 参数 的 版 本 中 ， 比 较 
操作 是 由 操作 符 < 来 执行 的 。 加 

STL 还 有 很 多 算法 。 如 果 使 用 得 当 ， 练习 2 至 练习 7 就 容易 得 多 。 这 一 节 的 练习 进一步 
探索 了 STL 算法 。 


27. 编写 C++ 代码 实现 三 个 参数 的 模板 函数 accumulate。 测 试 代码 。 

28. 编写 C++ 代码 实现 四 个 参数 的 模板 函数 accumulate。 测 试 代码 。 

29. 编写 C++ 代码 实现 模板 函数 copy。 测 试 代码 。 

30. 修改 程序 1-35， 输 出 所 有 不 同 元 素 的 所 有 排列 。 在 生成 排列 之 前 ， 把 表 元 素 按 升序 排列 。 
使 用 STL 的 排序 方法 


sort (start, end) 
它 把 范围 [start,end) 之 内 的 元 素 按 升序 排列 。 测 试 你 的 代码 。 
. 修改 程序 1-35， 输 出 所 有 不 同 元 素 的 所 有 排列 。 先 用 STL 算法 next permutation 生成 比 初 始 
排列 大 的 排列 ， 再 用 STL 算法 prev_permutation 生成 比 初始 排列 小 的 排列 。 测 试 你 的 代码 。 
32. 修改 程序 1-35， 输 出 所 有 不 同 元 素 的 所 有 排列 。 注 意 ， 当 next_permutation 的 返回 值 是 
false 上 时， 序列 [start,end) 是 最 小 序列 。 因 此 ， 调 用 next_permutation 可 得 到 剩余 的 排列 。 
测试 你 的 代码 。 

33. 使 用 STL 算法 count 做 练习 2。count 的 语法 是 : 
count (start,end ,value) 


34. 使 用 STL 算法 fill 做 练习 3。fill 的 语法 是 : 


fill (start,end value) 


35. 使 用 STL 算法 inner product 做 练习 4。inner product 的 语法 是 : 


3 


uh 


inner product (startl,endl, start2,initialValue) 

36. 使 用 STL 算法 iota 做 练习 5。iota 的 语法 是 : 
iotalstart,end,value) 

37. 使 用 STL 算法 is_sorted 做 练习 6。is_sorted 的 语法 是 : 
is sorted (start,end) 

38. 使 用 STL 算法 mismatch 做 练习 7。mismatch 的 语法 是 : 
mismatch (startl,endl,start2) 


39. 编写 C++ 代码 ， 实 现 练习 33 的 STL 模板 函数 count。 测 试 你 的 代码 。 

40. 编写 C++ 代码 ， 实 现 练习 34 的 STL 模板 函数 fill。 测 试 你 的 代码 。 

41. 编写 C++ 代码 ， 实 现 练习 35 的 STL 模板 函数 inner product。 测 试 你 的 代码 。 
42. 编写 C+ 代码， 实现 练习 36 的 STL 模板 函数 iota。 测 试 你 的 代码 。 

43. 编写 C++ 代码 ， 实 现 练习 37 的 STL 模板 函数 is_sorted。 测 试 你 的 代码 。 

44. 编写 C++ 代码 ， 实 现 练习 38 的 STL 模板 函数 mismatch。 测 试 你 的 代码 。 


1.9 测试 与 调试 
1.9.1 什么 是 测试 
如 1.1 节 所 示 ， 正 确 性 是 程序 最 重要 的 属性 。 可 是 ， 哪 怕 一 个 小 程序 ， 用 数学 方法 严格 
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地 去 证 明 它 的 正确 性 都 是 很 困难 的 ， 因 此 我 们 转 而 求助 于 程序 测试 ( program testing )。 在 程 
序 测试 中 ， 我 们 在 目标 计算 机 上 ， 用 一 组 输入 数据 来 实际 运行 一 个 程序 ， 然 后 将 运行 结果 与 
期 望 结 果 相 比较 。 这 组 输入 数据 称 为 测试 数据 ( test data )。 如 果 两 个 结果 不 同 ， 就 可 以 判定 
程序 有 问题 。 遗 憾 的 是 ， 即 使 两 个 结果 相同 ， 也 不 能 断定 该 程序 是 正确 的 ， 因 为 对 于 其 他 的 
测试 数据 ， 两 个 结果 有 可 能 不 同 。 如 果 使 用 了 多 组 测试 数据 都 能 得 到 两 个 相同 的 结果 ， 我 们 
对 程序 的 正确 性 就 增加 了 信心 。 如 果 使 用 了 所 有 可 能 的 测试 数据 ， 我 们 就 可 以 判定 程序 是 正 
确 的 。 然 而 对 于 大 多 数 的 实用 程序 ， 可 能 的 测试 数据 实在 太 多 了 ， 不 可 能 一 一 测试 。 实 际 使 
用 的 测试 数据 仅仅 是 一 部 分 ， 这 一 部 分 称 为 测试 集 (test set )。 

例 1-6[ 二 次 方程 求解 ] 一 个 x 的 二 次 函数 ( quadratic function ) 形式 如 下 : 

co 十 bx+c 

其 中 a、b、c 的 值 是 实数 ， 而 且 a 关 0。 例如，3x -2x+4、-9x -7Tx、3.57+4 以 及 5.8C+3.2x+5 
都 是 二 次 函数 ， 而 5x+3 不 是 。 

一 个 二 次 函数 的 根 ( root ) 是 使 函数 值 为 0 的 那些 x 的 值 。 例如， 函数 f(x)=xe-5x+6 的 根 
是 2 和 3， 因 为 f(2)=f(3)=0。 每 个 二 次 函数 都 有 两 个 根 ， 且 按 如 下 公式 计算 : 

-b+tVb’ -4ac 


2a 
对 函数 f(x)=x*-5x+6 而 言 ，a=1，p=-5，c=6， 把 它们 代入 公式 便 得 到 : 
5+V25-4*1*6 5+1 
2 2 


所 以 函数 f(x) 的 根 为 x=3 和 x=2。 

当 d=b?-4ac=0 时 ， 两 个 根 相 同 ; 当 q>0 时 ， 两 个 根 不 相同 且 为 实数 ; 当 4d<0 时 ， 两 个 根 
不 相同 且 为 复数 ， 实 部 为 -b/2a， 虚 部 为 Vy-4/(2a) ， 复 数 根 为 “ 实 部 + 虚 部 #i” 和 “ 实 部 - 
虚 部 *i”， 其 中 i= V=-1 。 

程序 1-36 的 函数 outputRoots 计算 并 输出 一 个 二 次 方程 的 根 。 对 这 样 的 程序 ， 我 们 不 是 
要 通过 规范 的 证 明 来 确定 其 正确 性 ， 而 是 要 通过 测试 来 确立 其 正确 性 。 所 有 可 能 的 测试 数据 
是 全 部 三 元 组 (a, 5, c)， 其 中 a 关 0。 即 使 a、b 和 c 都 被 限制 为 16 位 非 负 整数 ， 其 数目 
也 是 巨大 的 ,不 可 能 都 用 来 测试 程序 。 假 设 每 一 个 整数 都 是 16 位 ， 那 么 b 和 cc 取 不 同 值 的 数 
量 都 是 2“，ax 取 不 同 值 的 数量 是 2-1 (a 不 能 是 0)， 于 是 不 同 三 元 组 的 数量 是 232* ( 2!6_1 )。 
如 果 目 标 计算 机 每 秒 处 理 1 000 000 个 三 元 组 ， 则 需要 9 年 才能 完成 测试 。 更 快 的 计算 机 ， 假 
设 每 秒 处 理 1 000 000 000 个 三 元 组 ， 也 需要 3 天 。 所 以 ,我 们 只 能 从 全 部 测试 数据 中 取出 一 
小 部 分 用 来 测试 程序 。 





程序 1-36 ”计算 并 输出 一 个 二 次 方程 ec + bx +c 的 根 
void outputRoots{const double& a, const doubleg& b, const doubleg c) 


{W/ 计算 和 输出 二 次 方程 的 根 


duBil 让 尽 三 稳 丰 一 和 
if (d > 0) {/W 两 个 实数 根 
double sartd = sqrt(d); 
cout << "There are two real roots " 
< (Bb + sqrtd) 7 (2 w% a < " nd 
< {Bb - Sgrtd) 7 (2 ™ al) 
<< endl; 





else if (d == 0) 
/ 两 个 根 相 同 
Cout << "There is only one distinct root " 
<< =B 7 WE a) 
<< endil; 
else /中 复数 共 示 根 
cout << "The roots are complex" 
<< endl 
<< "The real part is " 
<< -Eb /A (2 * a «< endl 
<< "The imaginary part is " 
<< Sgrt(l-d} / (2 * a&) <x enadl; 
} 


如 果 使 用 数据 集 (a, b, c ) = (1，-5, 6 ) 来 进行 测试 ,程序 输出 的 根 是 2 和 3， 这 与 
期 望 的 结果 一 致 。 程 序 对 于 这 个 测试 数据 而 言 是 正确 的 。 加 

测试 的 目的 不 是 要 证 明 程 序 是 否 正确 ， 而 是 要 暴露 程序 的 错误 ! 因此 ， 选 择 的 测试 集 一 
定 要 能 暴露 程序 的 错误 。 测 试 集 不 同 ， 暴 露 的 程序 错误 也 不 同 。 

例 1-7 测试 数据 (a, b, c)= (1,， -5, 6) 使 函数 outputRoots 的 代码 产生 两 个 实数 
根 。 如 果 输 出 的 是 根 2 和 3， 那 么 我 们 可 以 相信 ， 在 本 次 测试 中 所 执行 的 语句 是 正确 的 。 但 
是 ， 一段 错误 的 代码 也 可 能 产生 正确 的 结果 。 例 如 ， 在 代码 中 ， 如 果 关 于 4 的 表达 式 漏 掉 a， 
错 写成 : 


double d=b*b-4*c; 


那么 4 的 值 与 从 测试 数据 得 到 的 值 相同 ， 因 为 a=1。 因 为 测试 数据 (1，-5，6 ) 没有 执行 所 
有 语句 ， 所 以 我 们 对 没有 执行 的 语句 没有 信心 。 

测试 集 { (1，-5, 6), (1, 3，2),，(2，5$,，2 ) } 仅 可 能 暴露 outputRoots 代码 的 前 7 行 
语句 的 错误 ， 因 为 测试 集 的 每 一 个 三 元 组 仅 需要 执行 前 7 行 语 句 。 而 测试 集 1(1，-5，6 )， 
(1，-8，16),，(1，2，5 ) } 需要 执行 每 条 语句 ， 因 此 该 测试 集 可 以 暴露 更 多 的 错误 。 国 


1.9.2 ”测试 数据 的 设计 


在 设计 测试 数据 的 时 候 ， 要 牢记 测试 目标 是 暴露 错误 。 如 果 用 来 暴露 程序 错误 的 测试 数 
据 没 有 暴露 出 程序 错误 ， 我 们 就 可 以 相信 程序 是 正确 的 。 为 了 清楚 对 于 给 定 的 一 组 测试 数据 
程序 是 否 存 在 错误 ， 首先 必须 知道 对 于 该 测试 数据 程序 的 正确 结果 应 是 什么 。 

例 1-8 以 程序 1-36 的 二 次 方程 求解 为 例 ， 对 任意 测试 数据 ， 有 两 种 方法 来 测试 程序 结 
果 的 正确 性 ， 你 可 以 任 选 一 种 。 一 种 方法 是 ， 我 们 知道 二 次 方程 的 根 。 例 如 ， 当 系数 (a，2， 
c)=(1，-5, 6) 时 , 方程 的 根 是 2 和 3。 我 们 可 以 用 测试 数据 ( 1，-5，6 )， 把 程序 计算 输 
出 的 根 与 2 和 3 进行 比较 ， 以 验证 程序 1-36 是 否 正确 。 另 一 种 方法 是 ， 把 程序 输出 的 根 代 入 
二 次 函数 以 验证 函数 的 值 是 否 真 为 0。 如 果 程 序 输 出 的 根 是 2 和 3， 那么 f(2) = 22-5*2 +6=0 
和 f(3) = 3*-5*3 + 6 = 0。 这 两 种 验证 方法 都 可 以 用 计算 机 程序 来 实现 。 第 一 种 方法 ， 检 验 程 
序 输入 三 元 组 (a, b, c ) 和 期 望 的 根 ， 把 程序 计算 出 的 根 与 期 望 的 根 进行 比较 。 第 二 种 方法 ， 
检验 程序 用 输出 的 根 计 算 方程 的 值 ， 验 证 函数 值 是 否 为 0。 加 

测试 数据 的 设计 标准 是 : 

e 这 组 数据 具有 暴露 程序 错误 的 可 能 吗 ? 
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e@ 使 用 这 组 数据 能 够 检验 程序 的 正确 性 吗 ? 

设计 测试 数据 的 技术 分 为 两 类 : 墨盒 法 和 和 白 盒 法 。 黑 盒 法 (black box method ) 考查 的 是 
程序 功能 ， 而 不 是 实际 的 代码 。 自 盒 法 ( white box method ) 考查 的 是 程序 代码 ， 以 便 设 计 出 
能 够 在 程序 执行 中 全 面 覆 盖 程 序 的 语句 和 执行 路 径 的 测试 数据 。 

1. 黑 盒 法 

最 常用 的 黑 盒 法 是 IO 分 类 和 因果 图 ， 本 节 仅 探讨 10 分 类 。 这 种 方法 把 输入 数据 和 输 
出 数据 分 成 若干 类 ， 不 同类 的 数据 使 程序 结果 有 质 的 不 同 ， 而 相同 类 的 数据 使 程序 结果 在 本 
质 上 类 似 。 以 二 次 方程 求解 为 例 ， 有 三 种 本 质 上 的 不 同 结果 : 根 是 复数 ， 根 是 实数 且 不 同 ， 
根 是 实数 且 相 同 。 根 据 这 三 种 结果 把 输入 数据 分 为 三 类 。 第 一 类 数据 产生 第 一 种 结果 ， 第 二 
类 数据 产生 第 二 种 结果 ， 第 三 类 数据 产生 第 三 种 结果 。 一 个 测试 集 应 该 至 少 包含 每 一 类 的 一 
个 输入 数据 。 

2. 白 盒 法 

白 盒 法 基于 代码 来 设计 测试 数据 。 对 一 个 测试 集 最 起 码 的 要 求 是 使 程序 的 每 一 条 语 
句 都 至 少 执行 一 次 。 这 种 要 求 被 称 为 语句 覆盖 ( statement coverage )。 以 二 次 方程 求解 为 
例 ， 测 试 集 1(1，-5，6), (1，-8，16), (1，2，5 ) } 使 程序 1-36 的 每 一 条 语句 都 得 
以 执行 ， 而 测试 集 { (0，1，2),， (1，-5, 6), (1,， 3，2),，(2，5，2 ) } 不 能 提供 语句 
和 于 = 

分 支 覆盖 ( decision coverage ) 要 求 测试 集 能 够 使 程序 的 每 一 个 条 件 都 分 别 取 到 true 和 
false 值 。 程 序 1-36 的 代码 有 两 个 条 件 : d>0 和 d==0。 

例 1-9[ 最 大 元 素 ] 程序 1-37 的 返回 值 是 数组 a[0:n-1] 最 大 元 素 的 位 置 。 该 程序 从 0 
到 n 扫描 数组 ， 以 查找 这 个 位 置 ， 用 变量 indexOfMax 来 记录 扫描 中 的 当前 最 大 元 素 的 位 置 。 
数据 集 {(a,-1),(a,4)} 和 a[0:4]=[2,4,6,8,9] 能 够 提供 语句 覆盖 ， 但 不 能 提供 分 支 覆盖 ， 因 为 条 
件 a[indexOfMax]<afi] 不 会 有 false 值 。 而 数据 集 a[0:4]=[4,2,6,8,9] 既 能 提供 语句 覆盖 也 能 提 
供 分 支 覆 盖 。 


程序 1-37 “寻找 a[0:n-1] 的 最 大 元 素 位 置 
template<class T> 
int indexOfMax(T a[]，int n) 
{// 查找 数组 a[0:n-1] 的 最 大 元 素 
if (n <= 0) 
throw illegalParameterValuel("n must be > 0"); 


int indexOfMax = 0; 
for (nt 主 二 下 2 二 且 和 有福 垃 二) 
if (a[lindexOfMax] < af[il) 
indexOfMax = i; 
return indexOfMax; 


团 

可 以 加 强 分 支 覆 盖 的 条 件 ， 要 求 每 个 条 件 的 每 个 从 句 既 能 出 现 true 也 能 出 现 false 的 情 

况 。 这 种 加 强 版 的 分 支 覆 盖 称 为 从 句 覆盖 ( clause coverage )。 一 个 从 旬 (clause ) 在 形式 上 被 

定义 成 一 个 不 包含 布尔 操作 符 ( 即 &&、]|、! ) 的 布尔 表达 式 。 表 达 式 x>y、x+y<y*z 和 cf(e 
是 布尔 类 型 的 ) 都 是 从 名 。 考 察 如 下 语句 : 
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if((Cl&&C2) | | (C38&8&C4)) S11; 

else S2; 

其 中 Cl、C2、C3 和 C4 是 从 名，S1 和 S2 是 语句 。 分 支 覆 盖 要 求 的 测试 集 能 使 条 件 
((C1&&C2)(C3&&C4)) 分 别 出 现 tue 和 false 的 值 。 而 从 句 覆盖 要 求 的 测试 集 能 使 4 个 从 名 
C1、C2、C3 和 C4 都 分 别 至 少 取 一 次 true 值 和 一 次 false 值 。 

还 可 以 继续 加 强 从 名 覆盖 的 条 件 ， 要 求 对 从 句 值 的 所 有 可 能 组 合 都 进行 测试 。 对 条 件 
((C1&&C2)I(C3&&Cc4))， 加 强 后 的 从 名 覆盖 要 求 测试 集 包 含 16 组 测试 数据 ， 每 组 测试 数据 
对 应 4 个 从 句 值 的 一 个 组 合 。 不 过 有 些 组 合 是 不 可 能 的 。 

按照 某 个 测试 集 来 排列 程序 语句 的 执行 次 序 ， 可 以 得 到 一 条 执行 路 径 。 不 同 的 测试 数 
据 可 能 产生 不 同 的 执行 路 径 。 程 序 1-36 仅 存在 3 条 执行 路 径 一 一 第 1 ~ 7 行 (第 1 行 始 于 
double d=…)， 第 1、2、8~12 行 , 第 1、2、8、13 ~ 19 行 。 而 程序 1-37 的 执行 路 径 随 着 n 
的 增加 而 增加 。 当 n = 0 时 , 仅 有 一 条 执行 路 径 一 一 第 1、2 行 (第 1 行 始 于 第 一 个 让 语句， 
第 3 行 是 空白 行 )。 当 n=0 时 ， 只 有 一 条 路 径 一 一 1 、4、5、8。 当 n=1 时 ， 有 二 条 路 径 一 一 1、 
4、5、6、5、8 和 1、4、5、6、7、5、8。 当 n=2 时 ， 有 4 条 路 径 一 一 1]、4、5、6、5、6、 
8 1 4 5 6 7 So 6 3, 8, 1 4 3 6 5, 6、 7、 5 ，L、 秆 、 3 而、7、 呈 、6、 了 7、 
8。 一 般 地 说 ， 对 n 三 0， 执 行路 径 的 数量 是 2"。 

执行 路 径 覆 盖 ( execution path coverage ) 要 求 测试 集 能 使 每 条 执行 路 径 都 得 以 执行 。 对 于 
二 次 方程 求解 程序 ， 语 句 覆 盖 、 分 支 覆盖 、 从 名 覆盖 以 及 执行 路 径 覆 盖 都 是 等 价 的 。 而 对 于 程 
序 1-37， 语 名 覆盖 、 分 支 覆 盖 和 执行 路 径 覆 盖 是 不 同 的 ， 而 分 支 覆 盖 和 从 名 覆盖 是 等 价 的 。 

在 目前 我 们 所 讨论 的 白 盒 测试 方法 中 ， 执 行路 径 覆 羡 一 般 是 要 求 最 多 的 。 一 个 测试 集 如 
果 能 实现 全 部 执行 路 径 覆 盖 ， 它 就 能 实现 语句 覆盖 和 分 支 履 盖 ， 然而， 可 能 无 法 实现 从 凶 覆 
盖 。 全 部 执行 路 径 覆 盖 所 需要 的 测试 数据 通常 是 数量 无 限 的 ， 或 至 少 是 数量 可 怖 的 ， 因 此 ， 
全 部 的 执行 路 径 覆 盖 在 实践 中 一 般 是 不 可 能 实现 的 。 

本 书 很 多 练习 都 要 求 你 测试 代码 的 正确 性 。 你 所 用 的 测试 数据 应 至 少 提供 语句 覆盖 。 此 
外 ， 你 必须 测试 那些 可 能 会 使 程序 出 错 的 特定 情况 。 例 如 ， 一 个 对 n(n = 0) 个 元 素 排 序 的 程 
序 ， 除 了 测试 n 的 正常 取 值 以 外 ， 还 必须 测试 n=0 和 1 这 两 种 特殊 情形 。 如 果 排 序 的 对 象 是 
数组 a[0:99]， 那 还 需要 测试 n=100 的 情况 。n=0,1 和 100 分 别 表示 数组 为 空 、 数 组 为 单 值 和 
数组 为 满 的 边界 条 件 ( boundary condition )。 


1.9.3 调试 


测试 可 以 暴露 程序 的 错误 。 一 旦 测试 结果 与 期 望 结果 不 同 ， 就 说 明 程序 有 错误 。 确 定 并 
纠正 程序 错误 的 过 程 称 为 调试 ( debugging )。 尽 管 透 彻 地 研究 程序 调试 的 方法 超出 了 本 书 的 
范围 ， 但 我 们 还 是 要 提供 一 些 建 议 : 

e 可 以 用 逻辑 推理 的 方法 来 确定 错误 的 原因 。 如 果 这 种 方法 失败 ， 还 可 以 进行 程序 跟踪 

(使 用 Microsoft Visual C++.NET 的 调试 器 )， 以 确定 程序 在 什么 时 候 出 现 错误 。 当 程 
序 需 要 执行 的 指令 很 多 ， 导 致 测试 集 和 程序 跟踪 耗 时 很 长 ， 难 以 人 工 完 成 时 ， 这 种 方 
法 就 不 可 行 。 这 时 ， 必 须 把 可 疑 的 代码 分 离 出 来 ， 专 门 跟 踪 。 

e 不 要 靠 产生 异常 来 纠正 错误 。 异 常 的 数量 将 迅速 增长 。 你 的 代码 会 像 一 碗 意大利 通 心 

面 一 样 杂乱 。 必 须 首先 确定 错误 的 原因 ， 然 后 在 必要 时 重新 设计 。 
e 在 纠正 一 个 错误 时 ， 要 保证 纠正 后 不 会 产生 新 的 错误 。 要 用 原来 使 用 过 上 且 测试 结果 正 
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确 的 测试 集 来 测试 纠正 后 的 程序 。 

e 测试 和 调试 一 个 含有 多 个 函数 的 程序 时 ， 要 从 一 个 独立 的 函数 开始 。 这 个 也 数 通 常 是 
一 个 输入 或 输出 函数 。 然 后 每 次 加 入 一 个 尚未 测试 的 函数 ， 使 程序 逐渐 变 大 。 这 种 策 
略称 为 增 量 测试 与 调试 ( incremental testing and debugging )。 利 用 这 种 策略 ， 把 检测 到 
的 错误 定位 在 刚刚 加 入 的 函数 之 中 是 合乎 逻辑 的 。 


练习 
45. 证 明 对 程序 1-36 既 可 以 提供 语句 覆盖 的 测试 集 ， 也 可 以 提供 分 支 覆 盖 和 执行 路 径 覆 盖 的 
测试 集 。 


46. 为 程序 1-37 设计 一 个 测试 集 ， 它 对 n=3 的 for 循环 可 以 提供 执行 路 径 覆 盖 。 
47. 程序 1-30 有 多 少 执行 路 径 ? 
48. 在 程序 1-31 的 rSum 函数 中 有 多 少 执行 路 径 ? 


1.10 ”参考 及 推荐 读物 


1 ) J. Cohoon, J. Davidson. C++ Program Design: An Introduction to Programming and Object- 
Oriented Design.3rd ed. McGraw Hill, NY, 2002. 

2 ) H. Deitel, P Deitel. C++ How to Program. 4th ed. Prentice Hall, Englewood Cliffs, NJ, 2002. 
以 上 两 本 书 是 比较 好 的 C++ 语言 人 门 教材 。 

3 ) 网 站 http:// codeguru.earthweb.com/spp/stlguide 有 关于 STL 所 有 内 容 的 说 明 。 

4 ) G. Myers. The Art of Software Testing. John Wiley, 1979. 

5 ) Boris Beizer Software Testing Techniques. 2nd ed. Van Nostrand Reinhold, 1990. 
后 两 本 书 对 软件 测试 及 调试 技术 有 透彻 的 讲解 。 
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概述 


程序 最 重要 的 属性 是 正确 性 。 一 个 程序 ， 如 果 不 能 正确 地 实现 算法 ， 它 就 没有 什么 用 处 。 
然而 ， 程 序 即 使 能 够 正确 地 实现 算法 ， 也 可 能 用 处 不 大 。 例 如 ， 一 个 程序 ， 如 果 需 要 的 内 存 
比 计算 机 可 用 的 内 存 还 要 大 ， 或 者 运行 时 间 比 用 户 愿 意 等 待 的 时 间 还 要 长 ， 那 么 这 样 的 程序 
就 没有 什么 意义 。 我 们 用 程序 性 能 ( program performance ) 来 指 一 个 程序 对 内 存 和 时 间 的 需 
求 。 要 对 数据 结构 和 算法 设计 方法 给 予 应 有 的 评价 ， 就 必须 能 够 计算 程序 性 能 。 

本 章 的 重点 是 学 习 手 算 程序 性 能 的 方法 。 我 们 用 操作 数 和 执行 步 数 来 估计 程序 的 运行 
时 间 。 用 符号 法 来 分 别 描述 程序 在 最 好 、 最 坏 和 平均 情况 下 的 运行 时 间 。 在 本 书 网 站 上 还 介 
绍 了 更 先进 的 运行 时 间 度 量 法 一 一 平 挫 复 杂 度 。 不 过 ， 你 要 在 学 完 第 9 章 之 后 ， 再 学 习 这 种 
方法 。 

第 3 章 复习 渐 近 符号 ， 诸 如 0O、Q、9、o。 它们 是 性 能 分 析 的 通用 语 。 使 用 渐 近 符号 法 
经 常 可 以 使 分 析 简 化 。 第 4 章 学 习 如 何 使 用 时 钟 来 度量 程序 的 实际 运行 时 间 。 

本 章 开 发 了 很 多 应 用 程序 ， 这 些 程序 在 以 后 的 章节 中 是 很 有 用 处 的 。 它 们 是 : 

数组 元 素 的 查找 。 

数组 元 素 的 排序 : 排列 排序 、 选 择 排序 、 冒 泡 排序 和 插入 排序 。 

基于 霍 纳 法 则 的 多 项 式 计算 。 

和 矩阵 加 法 、 转 置 和 乘法 。 


2.1 什么 是 程序 性 能 


所 谓 程序 性 能 ( performance of a program ) 是 指 运行 这 个 程序 所 需要 的 内 存 和 时 间 的 多 
少 。 我们 用 两 种 方法 来 确定 一 个 程序 的 性 能 ， 一 个 是 分 析 方 法 ， 男 一 个 是 实验 方法 。 在 性 能 
分 析 ( performance analysis ) 时 ， 采 用 分 析 方 法 ， 而 在 性 能 测量 ( performance measurement ) 
时 ， 使 用 实验 方法 。 
所 谓 一 个 程序 的 空间 复杂 度 ( space complexity ) 是 指 该 程序 的 运行 所 需 内 存 的 大 小 。 我 
们 对 程序 的 空间 复杂 度 感 兴趣 的 主要 原因 如 下 : 
e 如 果 一 个 程序 要 运行 在 一 个 多 用 户 计算 机 系统 中 ,那么 我 们 需要 指明 该 程序 所 需 内 存 
的 大 小 。 
e 在 任何 一 个 计算 机 系统 上 运行 程序 ， 都 需要 知道 是 否 有 足够 的 内 存 可 以 用 来 运行 该 程序 。 
。 一 个 问题 可 能 有 若干 个 解决 方案 ， 它 们 对 内 存 的 需求 各 不 相同 。 比 如 ， 对 于 你 的 计算 
机 来 说 ， 某 个 C++ 编译 器 仅 需要 1MB 的 空间 ， 而 另 一 个 C++ 编译 器 可 能 需要 4MB 
的 空间 。 如 果 你 的 计算 机 内 存 少 于 4MB ， 你 只 能 选择 1MB 的 编译 器 。 如 果 较 小 的 编 
译 器 和 较 大 的 编译 器 有 同样 的 作用 ， 那 么 即使 用 户 计算 机 有 更 多 的 内 存 ， 他 也 宁愿 使 
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用 较 小 的 编译 器 ， 以 便 把 更 多 的 内 存留 作 他 用 。 

e 利用 空间 复杂 度 ， 我 们 可 以 估算 一 个 程序 所 能 解决 的 问题 最 大 可 以 是 什么 规模 。 例 
如 ， 一 个 电路 模拟 程序 要 模拟 一 个 具有 ec 个 元 件 和 mw 个 连 线 的 电路 ， 需 要 104+ 
100(c+w) 字 节 的 内 存 。 如 果 可 用 内 存 的 总 量 是 5.01 x 1 字 节 ， 那 么 最 大 可 以 模拟 c+ 
w 和 5 000 000 的 电路 。 

所 谓 程序 的 时 间 复 杂 度 (time complexity ) 是 指 运行 程序 所 需要 的 时 间 。 我 们 对 程序 的 时 

间 复 杂 度 感 兴趣 的 主要 原因 如 下 : 

e。 有 些 计算 机 需要 用 户 提 供 程 序 运 行 时 间 的 上 限 ， 一 旦 达到 这 个 上 限 ， 程 序 将 被 强制 结 
束 。 你 可 以 简单 地 指定 时 间 上 限 为 几 千年 ， 但 是 如 果 你 的 程序 因为 数据 问题 而 陷 人 
死 循 环 ， 你 可 要 为 机 时 付出 巨额 资金 。 因 此 我 们 希望 时 间 上 限 稍 大 于 所 期 望 的 运行 
时 间 。 
正在 开发 的 程序 可 能 需要 一 个 令 人 满意 的 实时 响应 。 例 如 ， 所 有 交互 式 程序 都 必须 如 
此 。 一 个 文本 编辑 器 ， 光 标 上 移 一 页 或 下 移 一 页 需要 1 分 钟 ， 就 很 难 找到 用 户 ; 一 个 
电子 制 表 软 件 , 对 一 个 单元 重新 计 值 需要 几 分钟 ， 就 没 人 乐意 买账 ; 一 个 数据 库 管 理 
系统 ， 对 一 个 关系 进行 排序 时 ， 用 户 可 以 有 时 间 去 喝 两 杯 咖啡 ， 就 不 可 能 有 市 场 。 为 
交互 式 应 用 所 设计 的 程序 都 必须 具有 令 人 满意 的 实时 响应 。 利 用 程序 或 程序 模块 的 时 
间 复 杂 度 ， 我们 可 以 判定 响应 时 间 是 和 否 可 以 接受 。 如 果 不 能 接受 ， 那 就 要 重新 设计 算 
法 ,或 者 为 用 户 提供 一 台 更 快 的 计算 机 。 

如 果 一 个 问题 有 多 种 解决 方案 ,那么 具体 采用 哪 一 种 方案 ， 主 要 根据 这 些 方案 的 性 能 
差异 。 对 于 各 种 方案 的 时 间 和 空间 性 能 ， 我 们 将 采用 加 权 测 量 方式 进行 评价 。 


练习 


. 给 出 两 种 以 上 的 原因 说 明 为 什么 程序 分 析 员 对 程序 的 空间 复杂 度 感 兴趣 ? 
.给 出 两 种 以 上 的 原因 说 明 为 什么 程序 分 析 员 对 程序 的 时 间 复 杂 度 感 兴趣 ? 


[> 


2.2 空间 复杂 度 
2.2.1 空间 复杂 度 的 组 成 
程序 所 需要 的 空间 主要 由 以 下 部 分 构成 : 


(1 ) 指令 空间 ( instruction space ) 

指令 空间 是 指 编译 之 后 的 程序 指令 所 需要 的 存储 空间 。 

(2 ) 数据 空间 ( data space ) 

数据 空间 是 指 所 有 常量 和 变量 值 所 需要 的 存储 空间 。 它 由 两 个 部 分 构成 : 

e 常量 ( 例如 程序 1-29 和 程序 1-30 的 数 0 和 1) 和 简单 变量 ( 例如 程序 1-1 的 ab 和 ec) 

所 需要 的 存储 空间 。 

e 动态 数组 和 动态 类 实例 等 动态 对 象 所 需要 的 空间 。 

(3 ) 环境 栈 空 间 (environment stack space ) 

环境 栈 用 来 保存 暂停 的 函数 和 方法 在 恢复 运行 时 所 需要 的 信息 。 例 如 ， 如 果 函 数 foo 调 
用 了 函数 goo， 那么 我 们 至 少 要 保存 在 函数 goo 结束 时 函数 foo 继续 执行 的 指令 地 址 。 
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1. 指令 空间 

指令 空间 的 数量 取决 于 如 下 因素 : 

e 把 程序 转换 成 机 器 代码 的 编译 器 。 

e 在 编译 时 的 编译 器 选项 。 

e 目标 计算 机 。 

在 决定 最 终 代 码 需要 多 少 空间 的 时 候 ， 编 译 器 是 一 个 最 重要 的 因素 。 图 2-1 是 计算 表达 
式 atb+b*c+(a+b-c)/(a+b)+4 的 三 段 可 能 的 代码 ， 它 们 所 需要 的 空间 不 一 样 。 每 一 个 代码 都 由 
相应 的 编译 器 产生 。 


LOAD &a LOAD &a 
ADD b ADD b 
STORE t1 STORE 七 1 
SUB SUB 

DIV DIV 
STORE STORE 
LOAD LOAD 
MUL 

STORE ADD 
LOAD 

ADD 

ADD 








图 2-1 三 段 等 价 的 代码 


即使 采用 相同 的 编译 器 ， 编 译 后 的 程序 代码 也 可 能 不 同 。 例 如 ， 一 个 编译 器 可 能 具备 优 
化 选项 ， 如 代码 大 小 的 优化 和 执行 时 间 的 优化 等 。 在 非 优化 模式 下 ， 编 译 器 产生 的 是 图 2-lb 
的 代码 。 在 优化 模式 下 ， 编 译 器 可 能 利用 知识 atb+b*c=b#c+(a+b ) 而 产生 了 图 2-1c 所 示 的 更 
短 、 更 高 效 的 代码 。 不 过 ， 使 用 优化 模式 会 增加 程序 编译 的 时 间 。 

从 图 2-1 的 例子 中 可 以 看 出 ,一 个 程序 还 可 能 需要 其 他 额外 的 空间 ， 诸 如 临时 变量 t1， 
t 世 ，…，t6 所 占用 的 空间 。 

编译 器 的 覆盖 选项 也 可 以 显著 地 减少 程序 空间 。 在 覆盖 模式 下 ， 空 间 仅 分 配给 当前 正在 
执行 的 程序 模块 。 调 用 一 个 新 模块 需要 从 磁盘 或 其 他 设备 中 读 取 ， 新 模块 的 代码 将 覆盖 原 模 
块 的 代码 。 因 此 ， 程 序 所 需要 的 空间 便 是 最 大 模块 所 需要 的 空间 ， 而 不 是 所 有 模块 所 需要 的 
空间 之 和 。 

目标 计算 机 的 配置 也 会 影响 编译 后 的 代码 大 小 。 如 果 计 算 机 安装 了 浮 点 处 理 硬件 ， 那 么 
每 个 浮 点 操作 都 将 转换 成 一 条 机 器 指令 。 否 则 ， 就 需要 生成 代码 来 模拟 浮 点 操作 。 
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2. 数据 空间 

对 各 种 数据 类 型 ，C++ 语言 并 没有 指定 它们 的 空间 大 小 ， 只 是 大 多 数 C++ 编译 器 有 相应 
的 空间 分 配 ， 如 图 2-2 所 示 。 一 个 整 型 数据 空间 的 大 小 与 一 个 字 的 空间 大 小 一 样 (1 字 节 一 8 
位 )。 在 一 个 字 占 4 字 节 的 计算 机 中 ， 一 个 整 型 占 4 字 节 。 而 在 一 个 字 2 字 节 的 计算 机 中 ,一 
个 整 型 通常 也 是 2 字 节 。 当 我 们 计算 变量 和 常量 的 空间 大 小 时 ， 可 以 使 用 图 2-2 的 数据 。 






bool {true,false} 













char 1 [-128,127] 

unsigned char 1 [0,255] 

Short 2 [-32 768,32 767] 
unsigned short 2 [0,65 535} 

long 4 [22,231-1] 

unsigned long 4 [0,.22-1] 

int 4 [2 1] 

unsigned int 4 [0,232-1] 

float 4 +3.4E+38(7 位 ) 
double 8 + 上 1.7E+308 (15 位) 
long double 10 土 1.2E+4392 (19 位 ) 
pointer 2 (near，cs，ds，es，ss 指针 ) 
pointer (far,huge 指针 ) 








图 2-2 在 32 位 计算 机 上 C++ 数据 类 型 通常 占用 的 空间 


一 个 结构 变量 的 空间 大 小 是 每 个 结构 成 员 所 需 的 空间 大 小 之 和 。 类 似 的 ， 一 个 数组 的 空 
间 大 小 是 数组 的 长 度 乘 以 一 个 数组 元 素 的 空间 大 小 。 

考虑 如 下 的 数组 声明 : 

double al100]; 

int maze[rows] [cols]; 
当 计 算 分 配给 一 个 数组 的 空间 时 ， 我 们 只 关心 分 配给 数组 元 素 的 空间 。 数 组 a 的 空间 是 100 
个 double 类 型 元 素 所 占用 的 空间 。 若 每 个 元 素 空间 是 8 字 节 ， 则 数组 a 的 空间 是 800 字 节 。 
数组 maze 有 rows*cols 个 int 类 型 的 元 素 ， 占 用 的 空间 是 4*rows*cols 字 节 。 

3. 环境 栈 空 间 

在 开始 性 能 分 析 时 ， 人 们 通常 会 包 略 环境 栈 所 需要 的 空间 ， 因 为 他 们 不 理解 函数 ( 特别 
是 递归 函数 ) 是 如 何 被 调用 的 以 及 在 函数 调用 结束 时 会 发 生 什 么 。 每 当 一 个 函数 被 调用 时 ， 
下 面 的 数据 将 被 保存 在 环境 栈 中 : 

e 返回 地 址 。 

e 正在 调用 的 函数 的 所 有 局 部 变量 的 值 以 及 形式 参数 的 值 ( 仅 对 递归 函数 而 言 )。 

以 程序 1-31 的 递归 函数 rSum 为 例 ， 每 当 它 被 调用 时 ， 不 管 调用 来 自 函数 外 部 还 是 内 部 ， 
a 和 n 的 当前 值 以 及 调用 结束 时 程序 的 断口 地 址 都 被 存储 在 环境 栈 中 。 

值得 注意 的 是 ， 有 些 编译 器 ， 不 论 对 递归 函数 还 是 非 递 归 函 数 ， 在 函数 调用 时 ， 都 会 保 
留 局 部 变量 和 形 参 的 值 ， 而 有 些 编译 器 仅 对 递归 函数 才 会 如 此 。 因 此 ， 实 际 使 用 的 编译 器 将 
影响 环境 栈 所 需 空间 的 大 小 。 
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4. 小 结 

程序 所 需要 的 空间 大 小 取决 于 若干 因素 。 有 些 因素 在 构思 或 编写 程序 阶段 是 未 知 的 ( 例 
如 将 要 使 用 的 计算 机 或 编译 器 )。 不 过 即使 这 些 因 素 已 经 确定 ,我 们 也 无 法 精确 地 分 析 一 个 程 
序 所 需要 的 空间 。 

不 过 ， 程 序 要 处 理 的 问题 实例 都 有 一 些 特征 ， 这 些 特征 都 包含 着 可 以 决定 程序 空间 大 小 
的 因素 ( 例如， 输入 和 输出 的 数量 或 相关 数 的 大 小 )。 例 如 ， 对 n 个 元 素 排 序 的 程序 ， 它 所 需 
要 的 空间 大 小 是 n 的 函数 ，n 为 其 实例 特征 ; 将 两 个 nxn 和 矩阵 累加 的 程序 ，n 为 其 实例 特征 ; 
把 两 个 mxn 和 矩阵 相 加 的 程序 ，m 和 为 其 实例 特征 。 

相对 来 说 ， 指 令 空 间 的 大 小 受 实例 特征 的 影响 不 大 。 常 量 及 简单 变量 所 需要 的 空间 与 实 
例 特征 也 没有 多 大 关系 ， 除 非 相 关 数 的 规模 对 于 选 定 的 数据 类 型 来 说 实在 太 大 ， 这 时 ， 要 么 
改变 数据 类 型 ， 要么 使 用 多 精度 算法 重 写 该 程序 ， 然 后 再 对 新 程序 进行 分 析 。 

一 些 动态 分 配 空间 也 可 以 不 依赖 实例 特征 。 环 境 栈 的 大 小 一 般 不 依赖 实例 特征 ， 除 非 使 
用 了 递归 水 数 。 当 使 用 递归 函数 时 ， 实 例 特征 通常 影响 (但 不 总 是 ) 环境 栈 的 大 小 。 

递归 函数 所 需要 的 栈 空间 通常 称 为 递归 栈 
空间 ( recursion stack space )。 它 的 大 小 依赖 于 ee 
局 部 变量 和 形式 参数 所 需要 的 空间 ， 依 赖 于 递 rsum(a,n-2) 
归 的 最 大 深度 ( 即 垦 套 递归 调用 的 最 大 层次 ) 
和 编译 器 。 程 序 1-31 的 能 套 递归 调用 直到 nm . 
等 于 0， 概 套 调 用 的 层次 关系 如 图 2-3 所 示 ， rSum(a,1) 
最 大 的 递归 深度 是 n+1。 智 能 编译 器 可 以 把 尾 
递归 (tail recursion ) 转化 为 迭代 ， 从 而 减少 ， 图 2-3 程序 1-31 的 符 套 调用 层次 
甚至 排除 递归 栈 空 间 。 

可 以 把 一 个 程序 所 需要 的 空间 分 成 两 部 分 : 

e 固定 部 分 。 它 独立 于 实例 特征 。 这 一 部 分 通常 包括 指令 空间 ( 即 代 码 空间 )、 简 单 变 

量 空间 和 常量 空间 等 。 
e 可 变 部 分 。 它 由 动态 分 配 空间 构成 和 递归 栈 空 间 构成 。 前 者 在 某 种 程度 上 依赖 实例 特 
征 ， 而 后 者 主要 依赖 实例 特征 。 
任意 程序 P 所 需要 的 空间 可 以 表示 为 : 
c+Sp (实例 特征 ) 

其 中 c 是 一 个 常量 ， 表 示 空 间 需 求 的 固定 部 分 ，Sp 表示 空间 需求 的 可 变 部 分 。 要 精确 地 分 析 
空间 性 能 ， 还 要 考虑 在 编译 期 间 所 产生 的 临时 变量 所 需要 的 空间 ( 如 图 2-1 所 示 )。 这 种 空间 
是 与 编译 器 直接 相关 的 ， 除 递归 函数 以 外 ， 它 不 依赖 于 实例 特征 。 本 书 将 忽略 这 种 由 编译 器 
生成 的 变量 空间 。 

在 分 析 一 个 程序 的 空间 复杂 度 时 ， 我 们 将 集中 计算 Sp。 对 于 任意 给 定 的 问题 ， 我 们 首先 
要 确定 哪些 实例 特征 可 以 用 来 估算 空间 需求 。 选 择 实例 特征 是 一 个 很 具体 的 问题 ， 我 们 需要 
求助 于 实际 的 例子 来 说 明 各 种 可 能 的 情况 。 一 般 来 说 ， 我 们 的 选择 仅 限 于 程序 输入 和 输出 的 
规模 。 有 时 我 们 也 会 对 数据 项 之 间 的 关系 进行 复杂 的 估算 。 


2.2.2 ”举例 
例 2-1 考虑 程序 1-1。 在 计算 Se 之前， 必须 选择 实例 特征 。 假 定 我 们 用 a、b、e 值 的 大 
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人 村 征 。 因 为 a、b 、c 是 整 型 ， 所 以 每 一 个 都 占用 4 字 节 。 另 外 ， 需 要 的 空间 是 指 
空间 。 因 为 数据 空间 和 指令 空间 都 不 受 a、b、c 值 的 大 小 所 影响 ， 所 以 Se( 实例 特征 ) = 0。 
国 
例 2-2[ 顺序 查找 ] 程序 2-1 在 数组 中 从 左 至 右 查 找 第 一 个 与 x 相等 的 元 素 。 如 果 找 到 
了 ， 则 返回 它 第 一 次 出 现 的 位 置 。 如 果 没 有 找到 ， 则 返回 -1。 


程序 2-1 顺序 查找 


template<class T> 

int sequentialSearch(T al[l], int nr const Tg& x) 
{1/ 在 数组 a[0:n-1] 中 查找 元 素 x 

/ 如 果 找 到 ， 则 返回 该 元 素 的 位 置 ， 和 否则 返回 -1 


二 这 站 并 沁 
FG (和 二 Diz 机 和 下 二 ] = 总 宇 在 》 5 
if (i == n) return -1} 


else return i; 


} 


用 实例 特征 n 来 估算 程序 2-1 的 空间 复杂 度 。 虽 然 形 参 a、x、n， 常 量 0、-1， 以 及 代码 

Se ee 但 是 它们 都 不 依赖 实例 特征 n， 因 此 ，Ssoqventiasearcn(n) = 0。 
意 ， 数 组 a 必须 足够 大 ， 可 以 容 下 待 查找 的 n 个 元 素 。 这 个 数组 所 需要 的 大 小 为 n*s， 

其 中 s ER T 的 对 象 所 需要 的 字 节 数 。 然 而 ， 这 个 数组 所 需要 的 空间 已 在 定义 实际 参数 
的 函数 中 分 配 ， 所 以 在 函数 sequentialSearch 中 就 不 需要 再 分 配 了 。 而 

例 2-3 考虑 程序 1-30 的 函数 sum。 假 定 用 累加 元 素 的 总 数 n 作为 实例 特征 来 估计 空间 
复杂 度 。 在 该 函数 中 ， 形 参 a 和 n， 局 部 变量 1 和 theSum， 人 常数 0， 以 及 指令 都 需要 分 配 空 
间 。 但 是 所 需要 的 空间 与 n 的 值 无 关 ， 因 此 有 Sun(n) = 0。 国 

例 2-4 考虑 程序 1-31 的 图 数 rSum。 与 上 例 一 样 ， 假 定 实例 特征 为 n。 递 归 栈 空间 包 
括 形式 参数 a 和 an 以 及 返回 地 址 的 空间 。 对 于 a， 需 要 保留 一 个 指针 (4 字 节 )， 而 对 于 nm 则 
需要 保留 一 个 int 类 型 的 值 ( 也 是 4 字 节 )。 如 果 假 定 返 回 地 址 也 是 4 字 节 ,那么 每 一 次 递归 
调用 需要 12 字 节 的 栈 空 间 。 因 为 递归 深度 是 na+1， 所 以 递归 栈 空 间 需 要 12(n+1) 字 节 。 因 此 
Srsum(n) = 12(n+1)。 

程序 1-30 所 需要 的 空间 比 程序 1-31 所 需要 的 空间 要 小 。 国 

例 2-5[ 阶乘 ] 考虑 程序 1-29 的 阶乘 函数 。 它 的 空间 复杂 度 是 n 的 函数 而 不 是 输入 (只 
有 一 个 ) 或 输出 (也 只 有 一 个 ) 个 数 的 函数 。 递 归 深 度 是 max{fn,1}。 每 次 调用 函数 factorial， 
递归 栈 都 需要 保留 返回 地 址 (4 字 节 ) 和 n 的 值 (4 字 节 )。 此 外 没有 其 他 依赖 于 nm 的 空间 ， 
因此 Siwworia(n)=8*max {n,l1}。 画 

例 2-6[ 排列 ] 程序 1-32 输出 一 组 元 素 的 所 有 排列 。 初 始 调用 是 permutations(list,0,n-1)， 
递归 深度 是 n。 每 次 递归 调用 需要 20 字 节 的 递归 栈 空 间 ( 返回 地 址 、list、k、m 以 及 i 各 需要 
4 字 节 )， 因 此 Sonmuations(D)=20n。 图 





练习 


3. 如 果 采 用 两 种 C++ 编译 器 编译 一 个 C++ 程序 ， 那 么 生成 的 代码 长 度 相 同 还 是 不 同 ? 
4. 可 能 还 有 很 多 因素 影响 程序 的 空间 复杂 度 ， 请 列举 出 来 。 
5. 使 用 图 2-2 的 数据 来 计算 以 下 的 数组 所 需要 的 字 节 数 : 








1 ) double y[3] 

2 ) int matrix[10][100] 

3 ) double x[100][5][20] 

4 ) float z[10][10][10][5] 

5 ) bool a[2][3][4] 

6 ) long b[3][3][3][3] 
. 程序 2-2 是 在 数组 元 素 a[0:n-1] 中 查找 元 素 x 的 递归 函数 rSequentialSearch。 如 果 找 到 x， 
则 返回 x 在 a 中 的 位 置 ， 否 则 返回 -1。 计 算 Sp(n) 和 Sisequeniaisearch(D)。 
7. 编写 一 个 非 递归 函数 来 计算 nl ( 见 例 1-1 )。 并 和 程序 1-29 的 递归 函数 比较 空间 复杂 度 


程序 2-2 顺序 查找 的 递归 算法 


CN 


template<class T> 
int rSequentialSearch(T a[]j]，int n, const T& x) 
{1/ 在 数组 a[0:n-1] 中 查找 元 素 x 
// 如 果 找 到 ， 则 返回 该 元 素 的 位 置 ， 和 否则 返回 -1 
六 一 
if ‘(alii1] se X} TETUER BS 3 


return rSequentialsearch (a, n-l1, x); 





2.3 时间 复杂 度 
2.3.1 时 间 复 杂 度 的 组 成 


影响 空间 复杂 度 的 因素 也 影响 时 间 复 杂 度 。 一 个 程序 在 一 台 每 秒 执行 10? 条 指令 的 计算 
机 上 运行 要 比 在 一 台 每 秒 执行 10" 条 指令 的 计算 机 上 运行 快 得 多 。 图 2-1c 的 代码 要 比 图 2-1a 
的 代码 运行 时 间 少 。 一 些 编译 器 比 另 一 些 编译 器 生成 代码 的 速度 快 。 较 小 的 问题 实例 通常 比 
较 大 的 问题 实例 用 时 要 少 。 

一 个 程序 了 所 需要 的 时 间 是 编译 时 间 和 运行 时 间 之 和 。 编 译 时 间 与 实例 特征 无 关 。 一 
编译 过 的 程序 可 以 运行 若干 次 而 不 需要 重新 编译 。 因 此 我 们 将 主要 关注 程序 的 运行 时 间 。 运 
行 时 间 通 常用 “ip (实例 特征 )” 来 表示 。 

我 们 在 构思 一 个 程序 时 ， 对 影响 如 的 许多 因素 还 不 清楚 ， 因 此 我 们 对 tp 的 值 仅 能 估算 。 
如 果 我 们 了 解 编译 器 的 特征 ， 就 可 以 确定 代码 己 进 行 加 、 减 、 乘 、 除 、 比 较 、 加 载 、 存 储 等 
操作 所 需要 的 时 间 ， 从 而 可 以 得 到 一 个 计算 zz 的 公式 。 令 n 代表 实例 的 特征 ,tp(n) 的 表达 式 : 

ty(n)=ciAADD(n)+tcsSUB(n)+cn MUL(n)t+caDIV(n)+…: (1) 
其 中 c。、cs、cm、ca 分 别 表示 加 、 减 、 乘 、 除 所 需要 的 时 间 ， 函 数 ADD、SUB、MUL、 DIV 
分 别 表示 有 具有 实例 特征 n 的 程序 P 所 需要 的 加 、 减 、 乘 、 除 的 次 数 。 

因为 一 个 算术 操作 的 时 间 取 决 于 操作 数 的 类 型 ( int、float、double 等 )， 所 以 要 精确 地 计 
算 运 行 时 间 ， 必 须 按照 数据 类 型 对 操作 进行 分 类 。 在 这 种 情况 下 ,使 用 细 化 的 公式 (2-1 ) 还 
是 不 能 准确 地 计算 运行 时 间 ， 因 为 现在 的 计算 机 未 必 是 顺序 地 执行 算术 操作 。 例 如 ,计算 机 
可 以 同 时 站 和 一 个 续 斑 归 介 和 一 个 浮 点 型 操作 。 而 且 ， 算术 操作 流水 线 和 存储 等 级 ( 见 4.5 

节 ) 使 m 次 加 操作 的 时 间 未 必 是 一 次 加 操作 的 m 倍 。 
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用 分 析 方 法 确定 一 个 程序 的 运行 时 间 是 很 复杂 的 ， 因 此 只 能 佑 算 运 行 时 间 。 而 且 有 两 个 
比较 容易 控制 的 方法 : 1 ) 找 出 一 个 或 多 个 关键 操作 ， 确 定 它们 的 执行 时 间 ; 2 ) 确定 程序 总 
的 步 数 。 


2.3.2 ”操作 计数 


估算 一 个 程序 或 函数 的 时 间 复 杂 度 ， 一 种 方法 是 选择 一 种 或 多 种 关键 操作 ， 例 如 加 、 乘 、 
比较 等 ， 然 后 确定 每 一 种 操作 的 执行 次 数 。 使 用 这 种 方法 成 功 与 否 取 决 于 是 否 能 够 找到 耗 时 
最 大 的 操作 。 下 面 若干 个 例子 都 采用 了 这 种 方法 。 

例 2-7[ 最 大 元 素 ] 程序 1-37 的 返回 值 是 数组 a[0:n-1] 中 最 大 元 素 的 位 置 。 我 们 可 以 根 
据 数 组 元 素 之 间 的 比较 次 数 来 估算 时 间 复 杂 度 。 当 n < 0 时 ， 异常 抛 出 ， 比 较 次 数 为 0。 当 
n=1l 时 ， 没 有 进入 for 循环 体 ， 比 较 次 数 还 是 0。 当 n>1 时 ，for 循环 的 每 一 次 迭代 都 执行 一 次 
比较 ， 比 较 次 数 为 n-1。 因 此 总 的 比较 次 数 是 max{n-1,0}。 函 数 indexOfMax 还 执行 了 其 他 
的 比较 ,例如 在 每 一 次 迭代 之 前 都 要 做 一 次 i 和 n 的 比较 。 不 过 这 些 比 较 并 没有 包含 在 操作 
计数 的 估算 中 。 另 外 ，indexOfMax 的 初始 化 和 循环 控制 变量 i 的 增值 ， 也 没有 包含 在 操作 计 
数 的 估算 中 。 如 果 包 含 这 些 操作 ， 那 么 操作 计数 将 增加 一 个 常量 。 加 

例 2-8[ 多 项 式 求 值 ] 考虑 多 项 式 PG) =>cx? 。 如 果 c, 关 0， 那 么 Pen 是 一 个 n 阶 多 
项 式 。 程 序 2-3 是 对 给 定 的 x 值 来 计算 P(x) 值 。 它 的 时 间 复 杂 度 可 以 根据 for 循环 内 的 加 法 和 


乘法 的 次 数 来 估算 。 用 阶 数 n 作为 实例 特征 。 进 入 for 循环 的 总 次 数 为 x， 每 次 执行 1 次 加 法 
和 2 次 乘法 (不 包括 对 循环 控制 变量 i 的 加 法 操作 )。 因 此 加 法 的 次 数 为 x， 乘法 的 次 数 为 2n。 


程序 2-3 ”多 项 式 计算 








template<class T> 
TT pOlYEValt(tT GoBftft[]s int ns COonst TE& X) 
{1/ 计算 mn 阶 多 项 式 在 点 x 处 的 值 ， 系 数 为 coeff[0:n] 


Ty= 1, value = coeff[0]; 
for lint 1 = 1 4 <= ny 4141+4) 
1/ 加 上 下 一 项 

Y “= x; 


Value += y * coeffl[il]; 





return value; 


} 





利用 Horner 法 则 的 分 解 式 计算 一 个 多 项 式 如 下 : 
P(x) =(*""(Cn*X + Cn l)*XHCn 2) FX + Cn3)*X ***)*X+co 
因此 ，P(x) = 5*x*-4*x?+xX+7=((5*x-4)*x 寺 1)*x +7。 相 应 的 C++ 函数 见 程序 2-4。 采 用 程序 
2-3 的 估算 方法 ， 程 序 2-4 的 时 间 复 杂 度 是 n 次 加 法 和 nn 次 乘法 。 由 于 程序 2-3 的 乘法 次 数 是 
程序 2-4 的 两 倍 而 加 法 次 数 相 同 ， 因 此 后 者 应 该 更 快 。 


程序 2-4 利用 Horner 法 则 的 多 项 式 计算 








template<class T> 
T horner (T Coeft[]，int n, const T& x) 
{1/ 计算 n 阶 多 项 式 在 点 x 处 的 值 ， 系 数 为 coeff[0:n] 


T value = coeffl[ln]; 
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foF (iN 1 二 1 生 = WY 和 直下) 
value = Value * x + coeffl[ln - i]; 
return value; 


[ 

例 2-9[ 名 次 计算 ( ranking ) ] 一 个 元 素 在 一 个 序列 中 的 名 次 ( rank ) 是 所 有 比 它 小 的 元 

素 个 数 加 上 在 它 左边 出 现 的 与 它 相 同 的 元 素 个 数 。 例 如 ， 数 组 a=[4,3,9,3,7] 是 一 个 序列 ， 各 

元 素 的 名 次 为 r=[2,0,4,1,3]。 程 序 2-5 的 函数 rank 计算 数组 a 的 各 元 素 的 名 次 。rank 的 时 间 复 

杂 度 根据 a 的 元 素 比 较 次 数 来 估算 。 比 较 操 作 是 由 寺 语 名 来 完成 的 。 对 于 每 一 个 i 的 值 ， 比 
较 次 数 为 1， 因 此 总 的 比较 次 数 为 1+2+3+…+n-1= (n-l ) n/2( 见 公式 (1-3 ))。 


程序 2-5 ”名 次 计算 
template<class T> 
volid rank(T all: Aint n: Ant Ely) 
{// 给 数组 a[0:n-1] 的 n 个 元 素 排名 次 
1/ 结果 在 r[0:n-1] 中 返回 
for (int i = 0; i < n; i++) 
zi] = Cy /初始 化 


/ 比较 所 有 元 素 对 
二 在 年 于 十 委 汉 3 注 书 二) 
fi (Et | 守卫 交 和 
dE al[Jj] <= alily [1]++} 
else r[j]++; 
} 


注意 ， 在 估算 时 间 复 杂 度 时 ,没有 考虑 for 循环 的 经 常 性 用 时 、 数 组 r 初始化 的 用 时 以 及 
每 次 a 的 两 个 元 素 比 较 时 r 增值 操作 的 用 时 。 图 

例 2-10[ 按 名 次 排序 ( rank sort ) ] 数组 a 的 元 素 一 旦 由 程序 2-5 计算 出 名 次 ， 就 可 以 
移 到 与 其 名 次 对 应 的 位 置 ， 按 递增 顺序 重新 排列 ， 即 a[0] < a[1] 去 …< a[n-1]。 程 序 2-6 的 
函数 rearrange 使 用 一 个 附加 数组 u 实现 了 这 个 算法 。 

假设 调用 new 操作 符 给 附加 数组 u 分 配 空间 的 操作 是 成 功 的 。 那 么 在 执行 男 数 rearrange 
时 元 素 移动 次 数 是 2n0。 完 成 排序 需要 (n-1)n/2 次 比较 和 2n 次 元 素 移动 。 这 种 排序 方法 也 称 
计数 排序 ( count sort )。 实 现 这 种 排序 的 另外 一 种 方法 是 程序 2-11 ， 它 不 需要 附加 数组 u。 


程序 2-6 利用 附加 数组 的 计数 排序 


template<class T> 
void rearrange(T a[]，int n, int r[]) 
{1/ 使 用 一 个 附加 数组 u， 将 元 素 排 序 
T *u = new T [n]; /创建 附加 数组 


/把 aa 中 元 素 移 到 u 中 正确 位 置 
FSE Wit 1 0 工 宝 卫 守 二 二 
well es alils 


1/ 把 中 元 素 移 回 a 
GE ,位 .三 OF 1 < ny T+) 
EE 二 二 
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delete [] ui 
} 
加 
例 2-11[ 选择 排序 ( selection sort ) ] 给 数组 元 素 排序 ， 例 2-10 是 一 种 方法 ， 还 有 另 
一 种 方法 : 首先 找 出 最 大 的 元 素 ， 把 它 移 到 a[n-1]。 然 后 在 余下 的 n-1 个 元 素 中 找 出 最 大 的 


元 素 ， 把 它 移 到 an-2]。 如 此 进行 下 去 ， 直 到 剩 下 一 个 元 素 。 这 种 排序 方法 称 为 选择 排序 。 
图 2-4a 是 一 个 应 用 选择 排序 的 例子 ， 要 排序 的 数组 为 af0:5]=[6,5,8,4.3,1]。 阴 影 部 分 是 没有 排 
序 的 部 分 ， 深 色 杠 标志 的 是 最 大 元 素 的 位 置 ， 浅 色 杠 标志 的 是 最 大 元 素 要 移 向 的 位 置 。 








2 4 5 
8 好 





ve 
| 8|al3li 515[8[4 ey 
和 EE ms 
第 3 行 [加 [af els 515T 可 3T1 Ee 
第 4 行 [314[1|5[618 516]418[311 [可 线 可 5] 61 8] 
第 5 行 [31114[516]8 51614[318T1] 311| 4| 51 6[ 8] 
第 6 行 (3 14[5[618 51614[13[1[8] 了 [314151618 

a) 选择 排序 b) 一 次 冒 泡 过 程 c) 冒 泡 排序 

图 2-4 选择 排序 和 冒 泡 排序 


图 2-4a 的 第 1 行 是 数组 的 初始 布局 ， 整 个 数组 元 素 a[0:5] 还 没有 排序 。 最 大 元 素 在 a[2]， 
要 移 向 的 位 置 是 al5]， 这 两 个 位 置 用 杠 符号 标志 。 交 换 这 两 个 位 置 上 的 元 素 。 交 换 之 后 ， 我 
们 只 需 考 虑 数组 元 素 a[0:4] 的 排序 问题 ， 因 为 a[5] 中 的 元 素 已 经 是 最 大 元 素 。 第 2 行 是 交换 
之 后 的 数组 布局 ，a[0:4] 的 最 大 元 素 是 a[0]， 这 个 元 素 应 该 与 a[4] 中 的 元 素 交 换 。 第 3 行 是 交 
换 后 的 结果 。 如 此 继续 下 去 。 在 第 6 行 ， 数 组 中 未 排序 的 部 分 只 有 一 个 元 素 a[0:0]， 它 小 于 或 
等 于 其 他 元 素 。 因 此 整个 数组 已 经 排 好 序 。 

程序 2-7 的 C++ 函数 selectionSort 实现 了 这 一 过 程 。 其 中 的 函数 indexOfMax 在 程序 
1-37 中 已 经 给 出 。 时 间 复 杂 度 可 以 根据 元 素 的 比较 次 数 来 估算 。 从 例 2-7 中 已 经 知道 ， 每 
次 调用 indexOfMax(a,size) 需要 执行 size-1 次 比较 ， 此 总 的 比较 次 数 为 n-1+n-2+…+1= 
(n-1)n/2。 元 素 的 移动 次 数 为 3n-1)。 选 择 排序 的 比较 次 数 与 按 名 次 排序 的 比较 次 数 相 同 ， 但 
元 素 移动 次 数 多 出 50%。 在 例 2-16 中 ,我 们 将 考虑 另 一 种 选择 排序 。 


程序 2-7 选择 排序 






















































































template<class T> 
void selectionSort(T a[], int n) 
{// 给 数组 a[0:n-1] 的 个 元 素 排序 
for (int size = n; size > 1; size-—) 
{ 
int Jj = indexOfMax (a, size); 
swap (a[jl; alsize - 1]); 
} 
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例 2-12[ 冒 泡 排序 ( bubble sort ) ] 这 是 一 种 简单 的 排序 方法 ， 它 使 用 一 种 “ 冒 泡 策略 ” 
把 最 大 元 素 移 到 序列 最 右 端 。 在 一 次 骨 泡 过 程 中 ， 相 邻 的 元 素 比 较 。 如 果 左 边 的 元 素 大 于 右 
边 的 元 素 ， 则 交换 。 假 定 有 6 个 元 素 [6,5,8,4,3,1] ( 见 图 2-4b 第 1 行 ). 首先 6 和 5 比较 并 交 
换 ， 结 果 如 第 2 行 所 示 。 然 后 6 和 8 比较 ， 无 须 交 换 。 接 下 来 8 和 4 比较 (第 3 行 ) 并 交换 ， 
结果 如 第 4 行 所 示 。 再 下 来 是 8 和 3 比较 并 交换 。 最 后 一 次 是 8 和 1 比较 并 交换 ， 结 果 如 第 
6 行 所 示 。 一 次 冒 泡 过 程 结 束 后 ， 最 大 的 元 素 肯 定 在 最 右 端 。 

程序 2-8 的 函数 bubble 是 对 数组 a[0:n-1] 的 一 次 冒 泡 过 程 ， 其 中 元 素 比 较 次 数 是 n-1。 


程序 2-8 ”一 次 冒 泡 过 程 
template<class T> . 
void bubblel({T al], int n) 
{1/ 把 a[0:n-1] 中 最 大 元 素 移 到 右边 
书面 六 rl) 
if (a[li] > a[li+1]) swap(aril，afi + 1]) 7， 
} 


函数 bubble 的 功能 在 于 把 最 大 元 素 移 到 序列 最 右 端 ， 因 此 可 以 用 来 替代 选择 排序 中 的 
indexOfMax ( 见 程序 2-7 )， 从 而 我 们 得 到 一 个 新 的 排序 函数 ， 如 程序 2-9 所 示 。 新 函数 的 比 
较 次 数 为 (n-1 ) n/2， 与 函数 selectionSort 的 比较 次 数 相 同 。 图 2-4c 是 数组 初始 布局 和 每 一 
次 冒 泡 过 程 之 后 的 数组 布局 。 


程序 2-9 ” 冒 泡 排序 


template<class T> 
void bubbleSort(T a[], int n) 
{1/ 对 数组 元 素 a[0:n - 1] 使 用 冒 泡 排序 
for (int 1 = n; 4 > 1 i§==) 
bubble (a, i); 





2.3.3 最 好 、 最 坏 和 平均 操作 计数 


到 目前 为 止 ， 所 有 例子 中 的 操作 计数 都 是 像 输 入 数 或 输出 数 那样 简单 的 实例 特征 的 函数 。 
如 果 把 其 他 一 些 操作 也 都 考虑 在 内 ， 有 些 例子 就 可 能 变 得 很 复杂 了 。 以 bubble 函数 为 例 ( 程 
序 2-8 )， 它 的 交换 次 数 不 仅 依赖 于 实例 特征 n， 而 且 依 赖 于 数组 元 素 的 具体 值 。 交 换 次 数 可 
在 0 到 n-l 之 间 变 化 。 既 然 操 作 计 数 并 不 总 是 由 实例 特征 唯一 确定 的 ， 我们 就 来 估算 最 好 、 
最 坏 和 平均 操作 计数 。 因 为 平均 操作 计数 通常 不 易 确定 ， 所 以 我 们 集中 分 析 最 好 和 最 坏 两 种 
操作 计数 。 

例 2-13[ 顺序 搜索 ] 对 程序 2-1 的 顺序 查找 函数 ,我 们 要 确定 x 与 数组 元 素 之 间 的 比 
较 次 数 。 我 们 自然 地 把 n 作为 实例 特征 。 可 是 比较 次 数 不 是 由 n 唯一 确定 的 。 例 如 ， 如 果 
n=100 且 x=a[0]， 那 么 仅 需 要 一 次 比较 。 如 果 x 不 在 数组 中 ， 则 需要 100 次 比较 。 

若 x 属 于 a， 则 查找 成 功 ， 和 否则 查找 不 成 功 。 查 找 不 成 功 时 的 比较 次 数 都 是 n。 如 果 查 找 
成 功 ， 则 最 少 比 较 1 次 ， 最 多 比较 n 次。 为 了 计算 平均 比较 次 数 ， 我 们 假设 所 有 数组 元 素 都 
不 相同 ， 但 每 个 元 素 被 查找 的 概率 都 相同 。 这 时 ， 查 找 成 功 的 平均 比较 次 数 如 下 : 
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例 2-14[ 在 有 序数 组 中 插入 元 素 ] 在 有 序数 组 中 插 和 人 一 个 新 元 素 ， 插 入 之 后 数组 依然 有 
序 。 例 如 ， 在 数组 a[0:4]=[2,4,6,8,9] 中 插入 3， 结 果 是 a[0:5]=[2,3,4,6,8,9]。 为 此 ， 从 数组 最 右 
端 开始 ， 连 续 把 一 些 元 素 向 右 移动 一 个 位 置 ， 直 到 为 新 元 素 找 到 插入 空间 。 图 2-5a 显示 了 这 
个 过 程 : 把 9、8、6 和 4 依次 向 右 移动 了 一 个 位 置 ， 然 后 把 3 插 到 a[1]。 
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a) 插入 b) 原 地 重 排 c) 原 地 重 排 
图 2-5 插入 和 重 排 


程序 2-10 利用 这 种 排序 方法 把 一 个 元 素 x 插入 一 个 有 序数 组 a[0:n-1]。 
程序 2-10 ”在 一 个 有 序数 组 中 插入 一 个 元 素 


template<class T> 

void insert(T all, intg& n, const T& x) 
{// 把 x 插入 有 序数 组 a[0:n-1] 

// 假设 数组 a 的 容量 大 于 nn 


人 和 

for (i = Nn-ly i 3S= 0 && x < alil? i--) 
| 主 和 4 三 起 [ 宣 ] > 

a[i+1] = x; 


n++” // 数组 a 多 了 一 个 元 素 
} 





现在 我 们 要 确定 x 与 数组 元 素 的 比较 次 数 。 我 们 自然 把 数组 的 初始 元 素 个 数 n 作为 实例 
特征 。 最 少 的 比较 次 数 是 1， 这 是 把 x 插入 数组 最 右 端的 时 候 出 现 的 情况 。 最 多 的 比较 次 数 
是 n， 这 是 把 x 插入 数组 最 左 端 的 时 候 出 现 的 情况 。x 的 可 能 插入 位 置 有 n+l 个 。 为 了 估算 
平均 的 比较 次 数 ， 我 们 假定 把 x 插入 任意 一 个 位 置 上 的 概率 是 相等 的 。 如 果 x 的 插入 位 置 是 
alit+1]，i 三 0， 则 比较 次 数 为 n-i。 如 果 x 的 插入 位 置 是 af0]， 则 比较 次 数 为 n。 因 此 平均 比 
较 次 数 为 : 





平均 比较 次 数 几乎 比 最 坏 情况 下 的 比较 次 数 的 一 半 大 1。 国 
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例 2-15[ 再 看 按 名 次 排序 ] 假定 对 数组 a 的 元 素 已 经 用 函数 rank ( 见 程序 2-5 和 例 2-9 ) 
计算 出 名 次 ， 并 将 名 次 存 于 数组 r。 在 不 借助 其 他 空间 的 条 件 下 ， 把 数组 a 的 元 素 按 名 次 排 
序 ， 即 原 地 重 排 (in-place rearrange )。 从 索引 i=0 开始 检查 数组 a 的 元 素 afij。 如 果 r[i]=i， 则 
i 增 1， 然后 按照 新 的 索引 1i， 检 查 下 一 个 数组 元 素 。 如 果 rfi] 六 i， 则 将 索引 分 别 为 1 和 fj] 
的 元 素 交 换 。 把 原来 索引 为 i 的 元 素 移 到 按 名 次 排列 的 位 置 。 在 索引 i 处 重复 这 种 操作 直到 
r[i]=i。 然 后 i 增 1， 按 照 新 的 索引 i， 检 查 下 一 个 数组 元 素 。 

图 2-5b 和 图 2-5c 是 一 个 原 地 重 排 的 例子 。 初 始 数组 是 a[0:5]=[d,a,e,f,c,b]， 数 组 元 素 的 名 
次 显示 在 数组 元 素 的 上 面 ， 初 始 名 次 r[0:5]=[3,0,4,5,2,1]。 从 索引 0 开始 检查 数组 元 素 。 因 为 
r[0] 和 0， 所 以 af0] 和 a[r[0]]=a[3] 交换 。 用 深 色 杠 标志 的 是 正在 检查 的 位 置 。 用 浅 色 杠 标志 
的 是 afi] 应 该 移 到 的 位 置 。 当 r[a[i]]=i 时 ， 只 有 af[i 有 深 色 杠 标志 。 阴 影 部 分 表示 还 没有 按 名 
次 排列 到 位 的 元 素 ( 即 r[i] 寺 i 的 元 素 afi] )。 

从 i=0 开始 ， Eo r[0] 关 0， 所 以 交换 a[0] 和 a[r[0]]=a[3]，r[0] 和 zr[3]， 结 果 是 图 2-5b 
的 第 2 个 布局 。 ，a[3] 已 经 按 名 次 就 位 ， 即 r[3]=3。 下 一 步 是 a[0] 和 a[r[0]]=a[5] 交换 ， 
以 及 ee 结果 是 图 2-5b 的 第 3 个 布局 。 然 后 是 a[0] 和 a[r[0]]=a[1] 以 及 
相应 的 名 次 交换 ， 结 果 是 图 2-5b 的 第 4 个 布局 。 现 在 ，r[0]=0， 因 此 把 i 增 1， 即 i=1， 继 续 
检查 ， 如 图 2-5c 的 第 1 个 布局 所 示 。 因 为 rf]=r[1]=1， 所 以 把 i 增 1， 即 i=2， 继 续 检 查 ， 如 
图 2-5c 的 第 2 个 布局 所 示 。 现 在 是 a[2] 和 a[r[2]]=a[4] 以 及 相应 的 名 次 交换 ， 结 果 是 r[2]=2。 
这 时 的 数组 已 经 有 序 ， 不 过 代码 不 能 检测 出 来 ， 只 有 继续 增加 i 的 值 ， 直 到 剩余 的 数组 元 素 
都 检查 完 为 止 。 因 此 ，i 增加 至 3 ( 见 图 2-5c 的 第 三 个 布局 )。 然 后 i 增 至 4 和 5。 

程序 2-11 是 原 地 重 排 函数 rearrange。 


程序 2-11 原 地 重 排 数 组 元 素 








template<class T> 
void rearrange(T a[], int ny int r[]) 
{1/ 原 地 重 排 数 组 元 素 使 之 有 序 
for (int 主 = 0; 9 < nr E+ 让 ) 
// 把 正确 的 元 素 移 到 a[i] 
while (r[i] != 1i) 
{ 
it 让 深交 (1 斑 ] 
swap(a[i], al[lt]); 
swap(r[i], r[t]); 
} 
} 





交换 次 数 从 最 少 0 ( 当 数 组 元 素 初始 有 序 时 ) 到 最 多 2 (n-1 )。 注 意 ， 每 次 交换 至 少 使 
一 个 元 素 移 到 正确 位 置 ( 即 afi] )。 因 此 最 多 需要 n-l 次 交换 ， 所 有 n 个 元 素 都 能 按 名 次 排 
列 。 练 习 20 将 证 明 ， 确 实 存 在 这 样 的 序列 ， 需 要 经 过 n-1 次 交换 才 会 有 序 。 因 此 ， 交 换 次 数 
最 少 为 0 (初始 元 素数 已 经 有 序 )， 最 多 为 2o-1) ( 包括 名 次 交换 )。 与 程序 2-6 相 比 ， 最 坏 执 
行 时 间 增 加 了 ， 因 为 需要 更 多 的 移动 ( 每 次 交换 需要 三 次 移动 )。 不 过 ， 程 序 所 需要 的 内 存 减 
少 了 。 国 

例 2-16[ 再 看 选择 排序 ] 程序 2-7 的 选择 排序 有 一 个 缺点 : 即使 元 素 已 经 有 序 ， 程 序 仍 
然 会 继续 运行 。 例 如 ， 即 使 数组 元 素 在 第 二 次 迭代 后 已 经 有 序 , for 循环 仍 要 执行 n-1 次 迭代 。 
为 了 去 除 不 必要 的 和 迭代， 我 们 在 查找 最 大 元 素 时 ， 同 时 检查 数组 是 否 已 经 有 序 。 程 序 2-12 执 
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行 了 这 种 策略 ， 它 把 查找 最 大 元 素 的 循环 语句 直接 和 函数 selectionSort 合并 在 一 起 ， 而 不 是 
作为 一 个 独立 的 函数 。 


程序 2-12 ”及 时 终止 的 选择 排序 


template<class T> 
void selectionSort(T al[l], int n) 


{1/ 及 时 终止 的 选择 排序 
bool sorted = false; 
for (int size = n; !sorted && (size > 1); size--) 


{ 

int indexOfMax = 0; 

sorted = true; 

1/ 查找 最 大 元 素 

for (int 半 = 1 主 < 司 王 Ze7 ++) 
if (a[lindexOfMax] <= al[li]) indexOfMax = i; 
else sorted = false; /无 序 

swap lalindexOfMax], alsize - 1]); 


} 


图 2-6a 用 数组 a[0:5]=[6,5,4,3,2,1] 的 排序 演示 了 程序 2-12 的 处 理 过 程 。 在 外 层 for 循环 
的 第 一 次 迭代 中 ，size=6， 而 且 当 i=1,2,3,4,5 时 ， 都 执行 了 语句 sorted=false。 在 a[0] 和 a[5] 
交换 之 后 ， 结 果 如 图 第 2 行 所 示 。 接 下 来 重新 回 到 外 层 for 循环 ， 这 时 size=5， 而 且 当 i=2,3,4 
时 ， 也 都 执行 了 语句 sorted=false。 在 a[1] 和 af[4] 交换 之 后 回 到 外 层 for 循环 ， 这 时 size=4， 
而 且 当 i=3 时 ， 执 行 了 语句 sorted=false。 在 a[2] 和 af[3] 交换 之 后 回 到 外 层 for 循环 ， 这 时 的 
数组 布局 如 图 第 4 行 所 示 ， 语 句 sorted=false 没有 执行 。 外 层 循 环 终止 。 图 2-6a 的 及 时 终止 
选择 排序 和 图 2-4a 的 选择 排序 相 比 ， 和 迭代 次 数 少 一 次 。 


012345 0 让 和 和 0 3 
Po [6] 1121 31314] [6151814[3 
第 2 行 E143]216] [36 [5]1 618]1413] 
第 3 行 加 区 可 [于 39] 5161s Ta 
第 4 行 [T121314]316] [415161813017] 
第 5 行 [IT213131516] 51715161s 1 
第 6 行 [11314]151e6]s| 
a) 及 时 终止 的 选择 排序 _b) 及 时 终止 的 冒 泡 排序 c) 插 入 排序 
图 2-6 排序 举例 
对 及 时 终止 的 选择 排序 ， 最 好 情况 是 初始 数组 a 有 序 ， 这 时 外 部 for 循环 仅 执 行 一 次 ， 
数组 元 素 的 比较 次 数 为 n-1。 最 坏 情 况 是 外 部 for 循环 直到 size=1 时 才 结 束 ， 数 组 元 素 的 比较 
次 数 为 (n-1) n/2。 在 最 好 和 最 坏 情况 下 ， 交 换 次 数 与 程序 2-7 的 相同 。 注 意 ， 在 最 坏 时 ,及 
时 终止 的 选择 排序 要 略 慢 一 些 ， 因 为 它 需要 额外 的 操作 以 维护 变量 sorted。 男 


例 2-17[ 再 看 冒 泡 排序 ] 与 选择 排序 一 样 ， 我 们 可 以 设计 一 个 及 时 终止 的 冒 泡 排序 。 如 
果 在 一 次 冒 泡 过 程 中 没有 发 生 元 素 互 换 ， 则 说 明 数 组 已 经 有 序 ， 这 时 可 以 提前 终止 冒 泡 过程 。 
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程序 2-13 是 一 个 及 时 终止 的 冒 泡 排 序 函 数 。 
程序 2-13 ”及 时 终止 的 冒 泡 排序 


template<class T> 

bool bubble(T a[], int n) 

{/ 把 数组 a[0:n-1] 中 的 最 大 元 素 移 到 最 右 端 
bool swapped = false; // 目 前 为 止 未 交换 
for' (int O07 LiL <n= 1 tt+) 

i¥ 《Ba[ 主 ] 3S a{li#1]) 
{ 
swap (la[lil];, ali + 1]); 
swapped = true; // 交换 
} 
return swapped; 


} 


template<class T> 
void bubbleSort(T a[], int n) 
{/ 及 时 终止 冒 泡 排 序 
for (int i = n; i > 1 && bubblel(la, i); i--); 


} 


图 2-6b 第 1 行 是 实例 ， 调 用 bubble(a,6) 使 图 从 第 1 行 变 为 第 2 行 。 调 用 bubble(a,5) 使 
图 从 第 2 行 变 为 第 3 行 。 每 一 次 调用 时 都 至 少 发 生 一 次 交换 。 而 调用 bubble(a,4) 时 没有 发 生 
交换 ， 排 序 终止 。 

最 坏 情况 的 比较 次 数 与 原来 程序 2-9 的 一 样 。 最 好 情况 的 比较 次 数 为 n-1。 国 

例 2-18[ 插入 排序 ] 程序 2-10 (在 有 序数 组 中 插入 一 个 元 素 ) 可 以 作为 一 种 排序 方法 
的 基础 。 因 为 只 有 一 个 元 素 的 数组 ， 即 单元 数组 ， 是 一 个 有 序数 组 ， 所 以 对 n 个 元 素 的 数组 ， 
可 以 从 第 一 个 元 素 所 构成 的 单元 数组 开始 ， 不 断 实 施 插入 操作 。 插 入 第 二 个 元 素 ， 得 到 2 个 
元 素 的 有 序数 组 。 插 入 第 三 个 元 素 ， 得 到 3 个 元 素 的 有 序数 组 。 如 此 进行 下 去 ， 最终 得 到 n 
个 元 素 的 有 序数 组 。 

图 2-6c 的 第 1 行 是 未 排序 的 数组 a[0:5]。 开 始 时 数组 分 两 段 : 有 序 段 a[0:0]， 无 序 段 
a[1:5]。 无 序 段 用 阴影 表示 。 把 元 素 a[1] 插 入 有 序 段 a[0:0]， 得 到 图 第 2 行 所 示 的 有 序 段 
a[0:1] 和 无 序 段 a[2:5]。 把 元 素 a[2] 插入 有 序 段 , 得 到 图 第 3 行 所 示 的 有 序 段 af0:2] 和 无 序 段 
a[3:5]。 再 连续 插入 三 次 之 后 ， 整 个 数组 有 序 。 

程序 2-14 的 函数 insertionSort 实现 了 这 种 方法 。 它 重 写 了 程序 2-10 的 函数 insert， 省 
去 了 这 个 函数 的 一 些 不 必要 的 操作 。 实 际 上 ， 还 可 以 把 新 的 insert 代码 直接 能 人 函数 
insertionSort 之 中 ， 从 而 得 到 程序 2-15 的 另 一 种 插入 排序 函数 ; 或 者 把 函数 insert 作为 内 联 
( inline ) 函数 ， 结 果 是 一 样 的 。 


程序 2-14 ”插入 排序 


template<class T> 
void insert(T a[], int n, const TE& x) 
{1/ 把 x 插入 有 序数 组 a[0:n-1] 
dn 注 交 
for (i = n-l; i >= 0 && x < a[lil; i--) 
a[li+1] = al[lil]; 
a[i+1] = x; 
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} 


template<class T> 
void insertionSort(T a[], int n) 
{1/ 对 数组 a[0:n-1] 实施 插入 排序 
for (intk EE 二 J» 于 区 my 于 二 天 )》 
{ 
中 志和 码 a[]3 
insert (a, i, t); 


} 


程序 2-15 另外 一 种 插入 排序 


template<class T> 
void insertionsort(T all], int n) 
{// 对 数组 a[0:n-1] 实施 插入 排序 
EO (ift EE = 1F LE < nm; Le) 
{W 把 a[i] 插入 a[0:i-1] 
Tt = alil; 


9 i 

for (j = i-l; 3] >= 0 g&& t < alj]; j=-) 
a[li#l] = [li]; 

a[j+1] = 七; 


} 
} 


两 种 插入 排序 的 比较 次 数 相 同 。 最 好 的 比较 次 数 是 n-1， 最 坏 的 比较 次 数 是 (n-1)n/2。 国 
2.3.4 步 数 


在 一 些 讨论 过 的 例子 中 ， 用 操作 计数 方法 来 估算 程序 的 时 间 复 杂 度 时 ， 都 是 针对 选 定 的 
操作 ， 而 忽视 了 其 他 的 操作 。 在 步 数 ( step-count ) 方法 中 ， 将 对 程序 / 函数 的 所 有 操作 部 分 
都 进行 统计 。 与 操作 计数 一 样 ， 步 数 也 是 实例 特征 的 函数 。 任 何 一 个 具体 的 实例 都 可 能 有 若 
于 个 特征 〈 例如 输入 个 数 、 输 出 个 数 、 输 入 和 输出 的 大 小 )， 但 是 步 数 是 特征 的 一 个 子 集 的 函 
数 。 通 常 我 们 选择 的 特征 都 是 我 们 感 兴趣 的 特征 。 例 如 ， 如 果 我 们 想 知 道 ， 程 序 的 运行 时 间 
( 即时 间 复 杂 度 ) 如 何 随 着 输入 个 数 的 增加 而 增加 ， 那 么 就 把 步 数 仅 看 成 是 输入 个 数 的 函数 。 
对 男 一 个 不 同 的 程序 ， 如 果 我 们 想 知道 的 是 ， 程 序 的 运行 时 间 如 何 随 着 输入 规模 的 增 大 而 增 
加 ,那么 就 把 步 数 仅 看 成 是 输入 规模 的 函数 。 因 此 ， 要 确定 一 个 程序 的 步 数 ， 必 须 先 确定 所 
要 采用 的 实例 特征 。 这 些 特征 不 仅 确定 了 在 步 数 计算 表达 式 中 的 变量 ， 还 确定 了 一 步 应 该 包 
含 多 少 次 计算 。 

在 选择 了 相关 的 实例 特征 以 后 ， 可 以 确定 什么 是 一 步 。 一 步 (a step ) 是 一 个 计算 单位 ， 
它 独 立 于 所 选 定 的 实例 特征 。10 次 加 法 可 以 视 为 一 步 ，100 次 乘法 也 可 以 视 为 一 步 , 但 nn 次 
加 法 不 能 视 为 一 步 ， 其 中 为 实例 特征 。m/2 次 加 法 或 ptg 次 减法 也 都 不 能 视 为 一 步 ， 其 中 
m、p 和 9 都 是 实例 特征 。 

定义 2-1[ 程序 步 ] 一 个 程序 步 (a program step ) 可 以 大 概 地 定义 为 一 个 语法 或 语义 上 
的 程序 片段 ， 该 片段 的 执行 时 间 独 立 于 实例 特征 。 

一 个 程序 步 所 表示 的 计算 量 可 能 与 男 一 个 程序 步 所 表示 的 计算 量 不 同 。 例如， 下 面 这 条 
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完整 的 语句 : 
return a+b+b*c+(at+b-c)/ (at+b)+4; 
只 要 它 的 执行 时 间 独 立 于 所 选用 的 实例 特征 ， 就 可 以 视 为 一 个 程序 步 。 也 可 以 把 如 下 语句 : 
X=Y7 
视 为 一 个 程序 步 。 
为 了 确定 一 个 程序 或 函数 的 步 数 ， 可 以 创建 一 个 初始 值 为 0 的 全 局 变量 stepCount。 把 这 
个 变量 的 增值 语句 艇 人 原 程序 ， 每 当 原 程序 或 原 函 数 的 一 条 语句 执行 一 次 ，stepCount 的 值 就 
增 1。 当 程序 或 函数 运行 结束 时 ，stepCount 的 值 便 是 程序 步 数 。 
例 2-19 把 stepCount 的 增值 语句 众人 程序 1-30， 得 到 程序 2-16。 程 序 运 行 结 束 时 ， 
stepCount 的 值 便 是 程序 1-30 的 程序 步 数 。 


程序 2-16 计算 程序 1-30 的 程序 步 数 


tempjlate<class T> 

T sum(T a[l], int n) 

{/ 返回 数值 数组 元 素 a[0:n-1] 的 和 
T theSum = 0:; 





stepCount++; /theSum = 0 是 一 个 程序 步 
for (int 宇 OF 1 +) 
{ 
stepCount++; // for 循环 的 每 一 次 条 件 判断 是 一 个 程序 步 
theSum += al[lil]; 
stepCount++; /theSum += a[li] 是 一 个 程序 步 
} 
stepCount++; 1/ for 循环 语句 的 最 后 一 次 条 件 判 断 是 一 个 程序 步 
stepCount++; /return theSum 是 一 个 程序 步 


return theSum; 


} 


程序 2-17 是 程序 2-16 的 一 个 简化 版 ， 它 仅仅 计算 stepCount 的 值 ， 最 终 计 算 结 果 和 程序 
2-16 的 一 样 。 如 果 stepCount 的 初 值 为 0， 在 程序 2-17 的 for 循环 结束 时 ，stepCount 的 值 是 
2n， 在 程序 结束 时 它 的 值 是 2n+3。 因 此 ， 程 序 1-30 中 的 sum 函数 所 需要 的 程序 步 数 是 2n+3。 


程序 2-17 程序 2-16 的 简化 版 


template<class T> 
T sum(T a[l], int n) 
{/ 返回 数值 数组 元 素 a[0:n-1] 的 和 
for (int i = 0; i < n; i++) 
stepCount=+2; 
stepCount=+3; 
return 0; 


区 

例 2-20 把 stepCount 的 增值 语句 和 垦 入 程序 1-31 的 函数 rSum， 得 到 程序 2-18。 函 数 

rSum 是 递归 函数 ， 它 需要 递归 栈 空间 。 注 意 ， 程 序 1-31 是 递归 函数 ， 它 需要 递归 栈 空间 。 

如 果 这 个 空间 不 足 ， 该 函数 就 可 能 运行 失败 。 为 了 分 析 步 数 ， 我 们 假设 内 存 充分 大 ， 足 以 支 
持 函 数 rSum 的 运行 所 需要 的 递归 栈 空 间 。 
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程序 2-18 计算 程序 1-31 的 程序 步 数 


template<class T> 
下 天 SEE [lls dant ny 
{W 返回 数组 元 素 a[0:n-1] 的 和 


stepCount++; Wif 语句 是 一 个 程序 步 

if (n > 0) { stepCount++; 1/ return 语句 和 调用 语句 是 一 个 程序 步 
Teturn: XSUMmM(As i=) + li-1]?s} 

stepCount++; // return 语句 是 一 个 程序 步 

return 0; 


} 


令 fisum(n) 是 函数 rSum 从 初始 调用 到 结束 调用 时 stepCount 的 增值 。 如 果 stepCount 的 初 
始 为 0， 那 么 rsum(0) = 2。 当 站 > 0 时 ，stepCount 的 增值 应 该 是 2 加 上 在 调用 语句 tsum (n-1) 
之 后 stepCount 的 增值 ， 于 是 ksum (n) = 2 + rsum (0-1)。 

在 分 析 一 个 递归 函数 的 步 数 时 ， 通 常 可 以 得 到 一 个 递归 公式 (例如 ，rsum (n)=2+ 
tisum (2-1)， 寻 二 0， 且 ksm (0) =2)。 这 种 递归 公式 称 为 递 推 方程 (recurrence equation )， 或 简 
称 为 递 推 。 反 复 蔡 换 可 以 求解 递 推 方程 ， 如 下 所 示 : 

fsum(n) = 2+tsum(n— 1) 
=2+2+tsa(n—2) 
= 4+tsum(n ~ 2) 


= 2n + fsum(0) 
=2n+2, n 之 0 


其 中 二 0。 因此， 程序 1-31 的 函数 rSum 的 步 数 为 2n+2。 

比较 程序 1-30 和 程序 1-31 的 步 数 ， 后 者 小 于 前 者 。 然 而 不 能 因此 断定 前 者 比 后 者 慢 ， 
因为 一 步 所 对 应 的 时 间 单 位 是 不 确定 的 。rSum 的 一 步 可 能 要 比 sum 的 一 步 需要 更 多 的 时 间 ， 
因此 rSum 很 可 能 要 比 sum 慢 。 

步 数 可 以 告诉 我 们 ， 程 序 的 执行 时 间 是 如 何 随 着 实例 特征 的 变化 而 变化 的 。 从 sum 的 步 
数 可 以 看 到 ， 如 果 n 加 倍 ， 程 序 运 行 时 间 也 近似 地 加 售 ; 如 果 n 增加 10 倍 ， 运 行 时 间 也 会 增 
加 10 们 。 因 此 可 以 预计 ， 运行 时 间 随 着 n 的 增加 线性 增长 。 

如 果 不 想 柑 入 stepCount 的 增值 语句 ， 可 以 建立 一 张 表 ， 列 出 每 条 语句 的 总 步 数 。 为 此 ， 
首先 要 确定 每 条 语句 每 次 执行 所 需要 的 步 数 ( se，steps per execution )， 以 及 该 语句 总 的 执行 
次 数 ， 即 频率 ( frequency )。 然 后 把 这 两 个 数据 相 乘 ， 便 得 到 每 条 语句 的 总 步 数 。 最 后 把 所 有 
语句 的 总 步 数 加 在 一 起 便 得 到 整个 程序 的 步 数 。 这 种 方法 称 为 剖析 法 ( profiling )。 

一 条 语句 的 执行 步 数 ( s/e ) 是 该 语句 在 执行 结束 之 后 ， 步 数 stepCount 的 增值 。 一 条 语 
句 的 步 数 与 该 语句 的 执行 步 数 ( s/e ) 有 很 大 差别 。 例 如 语句 : 


X=Sum (ay mn) 7 


的 步 数 为 1， 而 该 语句 的 执行 步 数 是 1+2m+3=2m+4， 其 中 2m+3 是 调用 sum 所 引起 的 
stepCount 的 增值 。 

图 2-7 列 出 了 在 程序 1-30 的 函数 sum 中 每 条 语句 的 执行 步 数 ( se ) 和 频率 。 程 序 的 总 步 
数 为 2n+3。 注 意 for 语句 的 频率 为 n+1 而 不 是 nw， 因为 循环 变量 i 必须 递增 到 hn，for 语句 才 
能 结束 。 


56 ”党 一 部 分 两 和 冀 知 大 


theSum += al[il]; 
return theSum,; 





图 2-7 计算 程序 1-30 的 步 数 


程序 2-19 是 rows x rows 矩阵 a[0:rows-1][0:rows-1] 的 转 置 。 称 矩阵 b 是 矩阵 a 的 转 置 ， 
当 有 是 仅 当 对 所 有 的 i 和 j， 有 b[i][j]=a[j][i]。 


程序 2-19 ”和 矩阵 转 置 


template<class T> 
void transpose (T **a, int rows) 


{1/ 原 地 完成 矩阵 a[0:rows-1] [0:rows-1] 的 转 置 


for (int i = 0; i < rows? i++) 
for (int Jj = i+l: 3 < rowss J++) 
swap (a[lil[j], al[lj]l [il); 


} 


图 2-8 是 程序 2-19 的 执行 步 数 表 。 让 我 们 来 推导 第 二 条 for 循环 语句 的 频率 。 对 于 的 
每 个 值 ， 该 语句 执行 次 数 为 rows-i， 因 此 频率 为 : 


rows-}| rows 
> (rows 一 站 = 人 = rows(rows + 1)/2 
9g=1 


1=0 


swap 语句 的 频率 为 : 
rows—1 rows~—1] 


> (rows —i-—1)= >,9 = rows(rows — 1)/2 
i=0 9=0 









void transpose(T **a, int rows) 


{ 













for ‘(int 和 主 = 07 i < YOWS? ++) rows+l 
for (int 3 = i+? J < FEOWS} 了 二 击 ) rows(rows +1)/2 | rows(rows +1)/2 
swap (a[i] [jl], a[ljll[lil); rows(rows —1)/2 | rows(rows —1)/2 


} 0 0 
mr | | wr | 
图 2-8 程序 2-19 的 执行 步 数 


有 了 时， 一 条 语句 的 执行 步 数 是 变化 的 。 例 如 ， 程 序 2-20 的 赋值 语句 便 是 如 此 。 其 中 函数 
inef 在 对 数组 前 置 元 素 求 和 时 的 效率 很 低 : 


bj]= Dalil, 其 中 j=0,1,…,n 一 1 


程序 2-20” 低 效 的 前 缀 求 和 程序 
template <class T> 
void inef{({T a[l], T b[]; int n) 
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(1/ 前 置 元 素 求 和 
For (int 3 = Ox 3 < na j++) 
b[j] = sum(a, j + 1); 


} 


我 们 已 知 函 数 sum(a,m) 的 执行 步 数 为 2m+3( 见 例子 2-19 )。 因 此 ， 在 函数 inef 中 ， 赋 
值 语 句 b[j]=sum(a,j+1) 的 执行 步 数 为 2(j+1)+3+1=27+6， 其 中 增加 的 1 是 把 函数 sum 的 值 赋 给 
b[j] 所 做 的 一 步 。 赋 值 语句 的 频率 为 n, 但 该 语句 的 总 步 数 并 不 是 (2j+6)n， 而 是 
+ =n(n+5) 
图 2-9 是 对 该 函数 的 完整 分 析 。 


void TinettT a&[l]js T blj: int n) 


{ 
fGr (Ent J 所 0 3 < ns j++) 


b[j] = sum(a, 3 + 1); 





2-9 程序 2-20 的 执行 步 数 


最 好 、 最 坏 和 平均 操作 计数 的 概念 可 以 很 容易 地 扩充 到 步 数 中 。 例 2-21 和 例 2-22 就 说 
明了 这 些 概念 。 

例 2-21[ 顺序 搜索 ] 图 2-10 和 图 2-11 分别 给 出 了 函数 sequentialSearch ( 见 程 序 2-1 ) 
在 最 好 和 最 坏 情况 下 的 步 数 分 析 。 


int sequentialSearch(T al[l], int n, const T& x) 
{ 

nt 主 

fOr (二 0; 二 区 下 SEE a] |! 

if (i == Nn) return =1» 


else return i; 


{ 
NE 并 生 


fOr (LL 二 0; i < nn te afi 


if (i == n) return -1; 


else return i; 





图 2-11 程序 2-1 在 最 坏 情况 下 的 步 数 
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为 了 分 析 一 个 成 功 查找 的 平均 步 数 ， 我 们 假定 数组 a 的 n 个 元 素 值 都 互 不 相同 ， 并且 x 
与 数组 的 任何 一 个 元 素 相 等 的 概率 都 是 一 样 的 。 在 这 样 的 假设 下 ， 一 个 成 功 查找 的 平均 步 数 
是 n 个 成 功 查找 的 执行 步 数 之 和 除 以 n。 为 此 ， 首 先 得 到 当 x=a[j] 时 的 步 数 ， 其 中 j 介 于 [0， 
n-1]， 如 图 2-12 所 示 。 


int sequentialSearch(T al[ll]l, int n, const T& x) 


{ 


int i; 
for (和 守 = 0 和 <n a alill 1= xr i++)y 
if (i == n) return -1; 


else return i; 





图 2-12 程序 2-1 在 当 x=a[j] 时 的 执行 步 数 
现在 可 以 计算 出 成 功 查找 的 平均 步 数 : 
0+9 = (n+7)/2 
这 个 值 比 非 成 功 查 找 的 步 数 的 一 半 还 大 一 点 。 
现在 假定 成 功 查 找 的 概率 为 80%， 并 且 每 个 x=ali] 被 查找 的 机 会 相同 ， 则 
sequentialSearch 的 平均 步 数 为 : 
0.8*( 成 功 查找 的 平均 步 数 )+0.2* (不 成 功 查找 的 步 数 ) 
=0.8(n+7)/2+0.2(n+3) 
=0.6n+3.4 国 


例 2-22[ 在 有 序数 组 中 插入 元 素 ] 程序 2-10 的 函数 insert 在 最 好 和 最 坏 情况 下 的 步 数 分 
别 如 图 2-13 和 图 2-14 所 示 。 


Yoid insert(T all; inte ny CoOnst Tt& X) 
{ 
int 2? 
£0 (和 主 = 遇 =1 和 = 0 BE <, Bli]; 1 
a[li+1] = ali]; 


a[li+1] = x; 
n++; // 一 个 元 素 插 入 a 





图 2-13 程序 2-10 的 最 好 执行 步 数 


x 的 插入 位 置 有 ntl 个， 为 了 计算 平均 执行 步 数 ,假定 把 x 插入 任何 位 置 上 的 概率 是 一 
样 的 。 如 果 x 的 插入 位 置 是 j, j = 0， 则 步 数 为 2n-2j+4。 因 此 平均 步 数 为 : 


] 立 w-0+ 立 4| 


1 < Rae 
n+ Yt = +I 
| 和 
rr NG) 
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[n(n + 1)+4(n+1)] 


_ (n+4)(n+1) 





void insert(T a[]，int& n, const T& x) 
{ 
3 让 


for (i 三 I=1% SS= 0 g& KX < ali]» i-=) 
li+l] 二 Ll]: 

a[i+1] = x} 

n+ 十 // 一 个 元 素 插入 a 











图 2-14 程序 2-10 的 最 坏 执行 步 数 
平均 步 数 比 最 坏 情 况 下 的 步 数 的 一 半 多 2。 玛 
练习 


8. 根据 例 2-8 的 分 析 ， 要 计算 多 项 式 3x4+4xz+Sz2+H6x+7， 程 序 2-3 需要 做 4 次 加 法 和 8 次 乘 
法 ， 程序 2-4 需 要 4 次 加 法 和 4 次 乘法 。 请 在 六 2 的 情况 下 ， 把 这 些 加 法 和 乘法 一 一 表示 
出 来 ， 而 且 把 每 次 的 加 数 和 乘 数 也 显示 出 来 。 
9. 对 数组 a[0:8]=[3,2,6,5,9,4,7,1,8] 计算 所 有 元 素 的 名 次 ， 并 存 于 数组 r ( 见 例 2-9 )。 
10. 假设 对 数组 a[0:6]=[3,2,6,5,9,4,8] 实施 程序 2-7 的 选择 排序 ， 请 画 出 类 似 于 图 2-4a 的 图 。 
11. 假设 对 数组 a[0:6]=[3,2,6,5,9,4,8] 实施 程序 2-8 的 冒 泡 过 程 ， 请 画 出 类 似 于 图 2-4b 的 图 。 
12. 假设 对 数组 a[0:6]=[3,2,6,5,9,4,8] 实施 程序 2-9 的 冒 泡 排 序 ， 请 画 出 类 似 于 图 2-4c 的 图 。 
13. 假设 在 有 序数 组 a[0:6]=[1,2,4,6,7,8,9] 中 插入 3， 请 画 出 类 似 于 图 2-5a 的 图 , 显示 程序 2-10 
的 插入 过 程 。 

14. 数组 a[0:8]=[g,h,i,f,c,a,d,b,e], 按 名 次 排序 结果 [0:8]=[6,7,8,5, 2,0,3, 1,4]， 请 画 出 类 似 于 
图 2-5b 和 图 2-5c 的 图 , 显示 原 地 重 排 函数 ( 见 程 序 2-11 ) 的 排序 过 程 。 

15. 1 ) 使 用 及 时 终止 选择 排序 ( 见 程 序 2-12 )， 对 数组 a[0:9]=[9,8,7,6,5,4,3,2,1,0] 排序 , 画 出 
类 似 于 图 2-6a 的 图 , 显示 排序 过 程 。 
2 ) 对 数组 a[0:8]=[8,4,5,2,1,6,7,3,0] 重复 过 程 1)。 

16. 使 用 及 时 终止 冒 泡 排序 ( 见 程序 2-13 )， 对 数组 a[0:9]=[4,2,6,7,1,0,9,8,5,3] 排序 , 画 出 类 似 
于 图 2-6b 的 图 ， 显 示 排 序 过 程 。 

17. 使 用 插入 排序 ( 见 程序 2-14 )， 对 数组 a[0:9]=[4,2,6,7,1,0,9,8,5,3] 排序 , 画 出 类 似 于 图 2-6c 
的 图 , 显示 排序 过 程 。 

18. 在 函数 sum ( 见 程序 1-30 ) 的 for 循环 中 ， 执 行 了 多 少 次 加 法 ( 即 调用 increment ) ? 

19. 函数 factorial ( 见 程序 1-29 ) 执行 了 多 少 次 乘法 ? 

20. 创建 一 个 输入 数组 a， 使 函数 rearrange ( 见 程序 2-11 ) 执行 n-1 次 元 素 交 换 和 三 1 次 名 次 


交换 。 
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21. 函数 matrixAdd ( 见 程序 2-21 ) 对 数组 元 素 执行 了 多 少 次 加 法 ? 


程序 2-21 和 矩阵 的 加 法 








template<class T> 


void matrixAdd( T **a, T **b, T *xc int numberOfRows, int numberOfColumns) 


{1/ 将 矩阵 a 和 bb 相 加 得 到 矩阵 c 
for (int i = 07 i < numberOfRows; i3++) 
for (int j = 0; j < numberOfColumns; j++) 
Sli = a [jl + HEL Ys: 
} 


22. 函数 transpose ( 见 程序 2-19 ) 共 执 行 了 多 少 次 交换 ? 


23. 试 确定 函数 squareMatrixMultiply ( 见 程 序 2-22 ) 在 两 个 2 xz72 和 矩阵 相 乘 时 执行 了 多 少 次 
乘法 。 


程序 2-22 ”两 个 闫 x 于 矩阵 的 乘法 





template<class T> 
void squareMatrixMultiply(T **a, 了 **b, T 
{1/ 将 n x nn 矩阵 a 和 hb 相 乘 得 到 和 矩阵 c 
for (int Ls 0 i «< n? Lt+) 
GE 二 0 3 芭 丽 5 可 于 十) 
{ 
T sum = 0; 
fo (XnE kK 


wg En ny) 


= 0; k < n; k++) 
Sum += a[li] [kK] * BLE)TI]S 


c[i] [jl] = sum; 


} 


24. 试 确定 函数 matrixMultiply( 见 程序 2-23 ) 在 实现 一 个 mxn 和 矩阵 与 一 个 nxp 矩阵 相 乘 时 
执行 了 多 少 次 乘法 。 


程序 2-23 ”m xn 和 矩阵 与 n xp 和 矩阵 的 乘法 
template<class T> 
vodd matrixMilitiply(T **a, T wh T “eoe, Ant m, nt mn, dnt p) 
{1/ 将 一 个 mxn 矩阵 a 和 一 个 nxXp 给 阵 b 相 乘 得 到 和 拭 阵 c 
for (int i 三 0; 4 < m; i111+) 
EO (EE = OF 3 < By jt+) 
{ 
T sum = .07 
for (int k = 9 EK < ny; $f+) 
sum += a[i] [kK] * b[k] [Jj] 
c[i]{(j] = sum; 


】 





25. 确定 函数 permutations ( 见 程序 1-32 ) 执行 了 多 少 次 交换 操作 ? 

26. 函数 minmax( 见 程 序 2-24 ) 是 查找 数组 a 的 最 大 元 素 和 最 小 元 素 。 令 n 为 实例 特征 。 试 
问 a 的 元 素 之 间 有 多 少 次 比较 ?程序 2-25 是 另 一 个 查找 方法 。 在 最 好 和 最 坏 情 况 下 的 比 
较 次 数 分 别 是 多 少 ? 试 分 析 两 个 函数 之 间 的 相对 性 能 。 
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程序 2-24 ”查找 最 大 和 最 小 元 素 





template<class T> 
bool minmax(T a[], int n, int& indexOfMin, int& indexOfMax) 
{// 在 a[0:n-1] 中 确定 最 小 和 最 大 元 素 的 位 置 
/ 如 果 少 于 一 个 元 素 ， 则 返回 false 
if£ (nn < 1) return false; 


indexOfMin = indexOfMax = 0; /初始 假定 
fer Tint RS TF 省 寺 直 ) 
{ 
if (alindexOfMin] > al[lil) indexOfMin = i; 
if (alindexOfMax] < al[i]) indexOfMax = i}; 


} 


return true; 


程序 2-25 ”查找 最 大 和 最 小 元 素 的 另 一 个 函数 
template<class T> 
bool minmax(T a[]，int n, int& indexOfMin, jnté& indexOfMax) 
{// 在 a[0:n-1] 中 确定 最 小 和 最 大 元 素 的 位 置 
1/ 如 果 少 于 一 个 元 素 ， 则 返回 false 
if (n < 1) return false; 


indexOfMin = indexOfMax = 0; /初始 假定 
Ber (int 主 = 二 y 涉世 二 于 直下 】 

if (alindexOfMin] > alil]) indexOfMin = i;} 

else if (a[lindexOfMax] < al[li]) indexOfMax = i; 


Leturn Eruez 


27. 在 递归 函数 rSequentialSearch( 见 程序 2-2) 中 ， 数 组 a 的 元 素 与 x 有 多少 次 比较 ? 
28. 程序 2-26 是 男 一 个 迭代 式 顺 序 搜索 函数 。 在 最 坏 情况 下 ，x 与 a 的 元 素 有 多 少 次 比较 ? 与 
程序 2-1 的 比较 次 数 对 比 ， 哪 一 个 函数 运行 得 更 快 ?” 为 什么 ? 


程序 2-26 ” 另 一 个 顺序 搜索 函数 


template<class T> 

int sequentialSearch(T a[]，int n, const T& x) 
{// 在 无 序 表 a10:n-1] 中 查找 x 

/如果 找 到 ， 返 回 它 的 位 置 ， 和 否则 返回 -1 


a[n] = x; // 假设 有 另外 一 个 位 置 可 以 用 来 存储 x 
jt. 袜 > 

和 (了 三 07 坟 [L] 1 过 六 下 二 中 志 

if (i == n) return -1; 

return i 


} 


29. 1 ) 在 程序 2-27 的 所 有 需要 的 位 置 插入 stepCount 的 计数 语句 。 
2 ) 删除 不 必要 的 语句 ， 简 化 1) 的 程序 。 简 化 后 的 程序 和 1) 的 程序 所 计算 出 的 stepCount 
值 相同 。 
3 ) 假定 stepCount 的 初 值 为 0， 当 程序 结束 时 ， 它 的 值 是 多 少 ? 
4 ) 采用 频率 方法 分 析 程 序 2-27 的 步 数 ， 列 出 步 数 表 。 
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程序 2-27 练习 29 的 函数 
void di(int, KI] ynt my 
{ 
for (int i=0;i<n;i+=2) 
XxX[i]+=2;» 
i=1; 
while (i<=n/2) 
{ 
iL] 
二 十 十 ? 


} 


30. 分 别 用 如 下 函数 完成 练习 29: 
1 ) indexOfMax ( 见 程 序 1-37 )。 
2 ) minmax ( 见 程 序 2-24 )。 
3 ) minmax ( 见 程 序 2-25 )， 确 定 在 最 坏 情况 下 的 步 数 。 
4 ) factorial ( 见 程序 1-29 )。 
5 ) polyEval ( 见 程序 2-3 )。 
6 ) horner ( 见 程序 2-4 )。 
7) rank ( 见 程序 2-5 )。 
8 ) permnutations ( 见 程序 1-32 )。 
9 ) sequentialSearch ( 见 程序 2-26 )。 确 定 在 最 坏 情况 下 的 步 数 。 
10 ) selectionSort ( 见 程序 2-7 )。 确 定 在 最 好 和 最 坏 情况 下 的 步 数 。 
11 ) selectionSort ( 见 程序 2-12 )。 确 定 在 最 好 和 最 坏 情况 下 的 步 数 。 
12 ) insertionSort( 见 程 序 2-14 )。 确 定 在 最 坏 情况 下 的 步 数 。 
13 ) insertionSort ( 见 程序 2-15 )。 确 定 在 最 坏 情况 下 的 步 数 。 
14 ) bubbleSort ( 见 程序 2-9 )。 确 定 在 最 坏 情况 下 的 步 数 。 
15 ) bubbleSort ( 见 程序 2-13 )。 确 定 在 最 坏 情况 下 的 步 数 。 
16 ) matrixAdd ( 见 程序 2-21 )。 
17 ) squareMatrixMnultiply ( 见 程序 2-22 )。 
.对 如 下 函数 完成 练习 29 中 的 1)、2) 和 3): 
1 ) transpose ( 见 程序 2-19 )。 
2 ) inef ( 见 程 序 2-20 )。 
. 确定 如 下 函数 的 平均 步 数 : 
1 ) rSequentialSearch ( 见 程序 2-2 )。 
2 ) sequentialSearch ( 见 程序 2-26 )。 
3 ) insert ( 见 程序 2-10 )。 
. 1 ) 对 程序 2-23 完成 练习 29。 
2 ) 在 什么 条 件 下 适合 交换 最 外 层 的 两 个 for 循环 ? 
34. 试 比 较 在 最 坏 情况 下 ， 函 数 selectionSort ( 见 程 序 2-12 )， 函 数 insertionSort ( 见 程序 2-15 ) 
以 及 函数 bubble Sort〈 见 程序 2-13 ) 的 元 素 移动 次 数 。 利 用 程序 2-11 完成 按 名 次 排序 。 
35. 在 最 坏 的 情况 下 ， 一 个 程序 所 需要 的 运行 时 间 和 内 存 一 定 同时 都 是 最 大 的 吗 ? 证 明 你 的 
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结论 。 
36. 重复 替换 以 求解 下 列 方程 ( 见 例 2-20 )。 


n=0 
I Buon n>0 


| 
l+1(n-2) n>0 


2 ) i(n) = 


2n+i(n—1) se 


4 tO) |g pew hy CR 


| 
3 ) i1(n) = 
| 
| 


5) tm) = |3# 00 1) | 
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概述 


在 第 2 章 我 们 介绍 了 程序 的 空间 和 时 间 复 杂 度 的 分 析 方 法 。 因 为 不 是 简单 地 估算 步 数 ， 
而 是 要 确切 地 计算 步 数 ， 所 以 计算 方法 有 些 繁 琐 。 本 章 我 们 要 复习 渐 近 记 法 。 当 实例 特征 很 
大 的 时 候 ， 程 序 性 能 的 说 明 需 要 这 种 方法 。 这 种 方法 仅 是 估算 步 数 。 在 这 里 ， 虽 然 大 O 记 法 
的 使 用 最 普遍 ， 但 是 8、9 和 小 o 记 法 也 是 很 常用 的 。 

在 3.2 节 ， 我 们 首先 简略 地 说 明 渐 近 记 法 。 昌 然 不 够 详尽 ， 但 足以 满足 本 书 分 析 的 需要 。 
比较 严格 的 说 明 出 现在 3.3 节 。 不 过 这 一 节 可 以 忽略 ， 对 以 后 的 学 习 没 有 多 大 影响 。 

为 了 说 明 渐 近 记 法 的 使 用 方法 ， 我 们 不 仅 要 引用 第 1 章 和 第 2 章 的 实例 ， 而 且 还 要 开发 
和 分 析 一 个 重要 而 有 效 的 查找 方法 一 一 有 序数 组 的 折 半 查找 (也 称 二 分 查找 )。 这 种 查找 方法 
也 可 以 作为 STL 的 折 半 查找 算法 (binary_search )。 


考察 程序 的 操作 计数 和 执行 步 数 有 两 个 重要 的 原因 : 1 ) 预测 程序 运行 时 间 如 何 随 着 实 
例 特征 的 变化 而 变化 ; 2 ) 对 两 个 功能 相同 的 程序 ， 比 较 它 们 的 时 间 复 杂 度 。 在 使 用 操作 计数 
时 ， 我 们 关注 的 是 某 些 “关键 ”的 操作 ， 而 忽略 了 其 他 的 操作 。 因 此 ， 使 用 这 种 方法 要 非常 
谨慎 。 例 如 ， 一 个 程序 可 能 比较 了 2n 次 ， 但 是 总 的 步 数 是 62+8n。 如 果 以 比较 次 数 22 来 断 
定 程 序 运行 时 间 是 n 的 线性 函数 ， 那 就 错 了 。 对 两 个 功能 相同 的 程序 ， 比 较 次 数 是 2n 的 程序 
和 比较 次 数 是 3n 的 程序 相 比 ， 如 果 你 认为 前 者 更 快 ， 可 能 也 不 对 ， 因 为 在 总 的 步 数 上 ， 后 者 
可 能 比 前 者 少 。 

操作 计数 说 明 的 仅 是 一 个 程序 中 的 一 部 分 工作 。 而 步 数 要 说 明 所 有 的 工作 。 然 而 ， 步 数 
的 概念 是 不 精确 的 。 指 令 x=y 和 x=y+z(x/y) 都 可 以 算 一 个 程序 步 。 对 同样 的 程序 ， 两 个 分 析 
员 计 算 的 步 数 可 能 相差 很 大 ， 比 如 一 个 为 42+6n+2， 另 一 个 为 7n2+3n+4。 我 们 不 能 判断 应 该 
是 哪 一 个 ， 因 为 任何 一 个 具有 形式 cim?+czn+c3 (ci>0 且 cl、c、cs 是 常数 ) 的 步 数 对 该 程序 都 
是 正确 的 。 一 步 表 示 什 么 ， 这 个 概念 并 不 严谨 ， 因 此 它 在 比较 程序 性 能 方面 的 用 处 不 是 很 大 。 
当然 ， 当 两 个 程序 的 步 数 相差 很 大 ， 比 如 3n+3 对 900n+10， 那 就 男 当 别论 了 。 我 们 可 以 毫 不 
犹豫 地 预测 ， 步 数 为 3n+3 的 程序 比 步 数 为 900n+10 的 程序 运行 时 间 要 少 。 

当 实 例 特征 n 很 大 时 ( 即 用 渐 近 记 法 表示 ，n 扑 近 无 穷 )， 使 用 步 数 可 以 准确 地 预计 运行 
时 间 的 增长 ， 以 比较 两 个 程序 的 性 能 。 假 定 一 个 程序 的 步 数 是 一 个 多 项 式 cin?+cyn+tcs, ci>0。 
当 n 很 大 时 ,cir? 要 比 cznt cs 大 很 多 。 它 们 的 比率 是 r(n)=(czn+c3)/cir?。 图 3-1 描绘 出 了 x(n) 
在 ci=1、cz=2 和 cs=3 时 的 变化 。 即 使 r(n) 永远 不 会 等 于 0, 但 是 随 着 n 越 来 越 大 ， 它 越 来 越 
接近 0。 

不 考虑 ci>0 和 c,、c; 的 值 ， r(n) 的 值 随 n 的 无 限 增 大 而 趋 于 0， 即 
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C2 C3 
» -一 一 十 2 = 0 
im 已 cin 


当 很 大 时 ，cznte; 与 cr 比 ， 其 大 小 是 不 重要 的 ， 因 此 程序 运行 时 间 可 以 近似 地 表示 

















为 cir?。 令 nn 各 是 nn 的 两 个 很 大 的 值 ， 我 们 有 近 5 
似 表 达 式 
1(m) SS Cm =( 包 4 
1(n,) cin? 172 
由 此 可 知 ， 当 实例 大 小 增加 到 2 倍 时 ， 运 行 时 3 一 
间 近 似 增加 到 4 倍 ; 当 实 例 大 小 增加 到 3 倍 时 ， 运 "中 
行 时 间 增 加 到 9 倍 ;以 此 类 推 。 只 要 认识 到 ， 执 行 2 | 
步 数 的 最 大 项 是 ww*， 而 且 其 系数 ci 的 值 无 关 紧 要 ， | 
我 们 就 能 得 出 上 述 结论 。 
假定 程序 4 和 B 具有 同样 的 功能 。 假 设 John 得 0 , 
出 的 步 数 是 4(n)=m2+3n，1s(n)=43n。 而 Mary 分 析 0 20 40 60 80 100 
的 结果 很 可 能 是 ia(n)=2m?+3n，ts(n)=83n。 假 使 John 图 3-1 tn)=2/m+3/w 的 图 


分 析 的 结果 是 正确 的 ,那么 所 有 其 他 人 的 分 析 结 果 
只 要 是 正确 的 ， 都 应 该 具有 形式 ts(n)=cin tcantes, ta(n)=can， 其 中 c1、c;、c3、c4 均 为 常数 ， 
ci>0 和 cs>0。 

要 理解 上 述 结论 ， 请 看 图 3-2。 首 先 看 John 的 分 析 曲 线 : 14(n)=n?+3n，ts(n)=43n。 当 
n<40 时 ， 程 序 4 更 快 ; 当 n>40 时 ,程序 8 更 快 ; n=40 是 两 个 程序 的 均衡 点 (break-even 
point )。 现 在 假定 分 析 结果 换 成 ts(n)=83n: 当 n<80 时 ， 程序 4 更 快 ; 当 n>80 时 ,程序 B 更 快 ; 


n=80 是 两 个 程序 的 均衡 点 。 只 要 nn 很 大 ， 程序 B 就 i 






















一 直 比 程序 4 快 。 这 个 结论 不 会 变 ， 变 的 只 是 均 pe ] 
衡 点 。 8000 -| 浏 
如 果 John 的 分 析 结 果 是 4(n)=2n*+3n， 那 fg 
么 情形 又 是 怎么 样 呢 ? 从 图 3-2 可 以 看 出 ,无 6000 -| 0 
论 18(m)=4371， 还 是 1s(m)=832， 只 要 三 足够 大 ， 程 xm 
序 8 都 一 直 比 程序 4 快 ( 对 ta(n)=43n,， n>20 ; 对 4000 — :4 
1a(n)=83n, n>40 )。 i 
为 得 到 上 述 结论 ， 我 们 需要 认识 到 ， 在 程序 4 | 
的 执行 步 数 中 ， 最 大 一 项 是 wr ; 而 在 程序 8 的 执行 vl | : 
步 数 中 ， 最 大 一 项 是 n ; 系数 ci 到 cs 的 值 与 结论 没 6 动 和 而 有- 动 
有 关系 。 渐 近 分 析 方 法 主要 确定 的 是 复杂 函数 中 的 n 
最 大 项 ( 但 不 包括 最 大 项 的 系数 )。 图 3-2 运行 时 间 函 数 比较 


3.2 渐 近 记 法 
3.2.1 大 O 记 法 


定义 3-1 令 p(n) 和 g(n) 是 两 个 非 负 函数 。 称 p(n) 渐 近 地 大 于 g(n) (p(n) 渐 近 地 优 于 
gq(n) )， 当 且 仅 当 
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gq(n) (3=1) 
Lim 也 pn) = =0 


称 g(n) 渐 近 地 小 于 p(n)， 当 且 仅 当 p(n) 渐 近 地 大 于 g(n)。 称 p(n) 渐 近 地 等 于 g(n)， 当 且 
仅 当 任何 一 个 都 不 是 渐 近 地 大 于 另 一 个 。 
例 3-1 因为 





l0n+7 -10z+7T/11 
“3n +2n+6 3+2/n+6/n’ 


所 以 3m+2n+6 渐 近 地 大 于 10n+7， 或 者 说 10n+7 渐 近 地 小 于 3n*+2n+6。 相 似 的 推论 有 ， 
8n*+9m 渐 近 地 大 于 100rn?-3，2m?+3n 渐 近 地 大 于 83n，12n+6 渐 近 地 等 于 6n+2。 国 

在 下 面 的 讨论 中 ，f(n) 作为 实例 特征 n 的 函数 ， 表 示 一 个 程序 的 时 间或 空间 复杂 度 。 因 
为 程序 的 时 间或 空间 复杂 度 是 一 个 非 负 数 ， 所 以 我 们 假设 函数 1 对 所 有 n 都 是 非 负 值 。 还 因 
为 n 代表 实例 特征 ， 所 以 n 三 0。 函 数 f(n) 一 般 是 若干 项 的 和 。 例 如 ，f(n)=9n*+3n+12， 其 中 
9m、3n 和 12 都 是 f(n) 的 项 。 我们 可 以 两 个 两 个 地 比较 ， 确定 哪 一 项 更 大 ( 见 定义 3-1 )。 本 
例 中 的 最 大 项 是 9n?。 

图 3-3 给 出 了 经 常 在 步 数 分 析 中 出 现 的 
项 。 虽然 其 中 所 有 项 的 系数 都 是 1, 但 是 在 实 
际 分 析 中 ， 这 些 项 的 系数 都 有 不 同 的 值 。 

图 3-3 的 对 数 都 没有 对 数 基 ， 原 因 是 对 于 
任何 大 于 1 的 常数 a 和 bb， 都 有 logsn=logsn/ 
logsa， 因 此 logsn 和 logsn 是 渐 近 相等 的 。 

利用 定义 3-1， 对 图 3-3 的 所 有 项 ， 可 以 
排列 出 它们 的 大 小 顺序 如 下 (其 中 < 表示 浙 
近 地 小 于 ): 


lim =0/3=0 





图 3-3 通常 出 现 的 项 


1<logn<n<nlogn<n <n’<2"<n! 

渐 近 记 法 (asymptotic notation ) 描述 的 是 大 实例 特征 的 时 间或 空间 复杂 度 。 我 们 将 用 它 
来 分 析 步 数 ( 其 实 还 可 以 用 它 来 分 析 空 间 复 杂 度 和 操作 步 数 )。 时 间 复 杂 度 和 步 数 是 同义词 。 
如 果实 例 特征 只 含有 一 个 变量 ,例如 nn， 渐 近 记 法 就 用 步 数 中 渐 近 最 大 的 一 项 来 描述 复杂 度 。 

表示 法 f(n)=O(g(n)) ( 读 作 “f(n)is big oh of g(n)”) 代表 f(n) 渐 近 小 于 或 等 于 g(n)。 在 渐 
近 的 意义 上 ，g(o 是 f(n) 的 上 限 。 这 里 的 “大 O” 可 以 作为 一 个 实用 性 定义 ， 它 的 严格 定义 
在 3.3.1 节 给 出 。 

例 3-2 使 用 “大 0” 记 法 描述 例 3-1 的 结果 为 : 10n+7 = O(G37P2+21+6) ; 100m-3 = 
O(8n*+9n’); 12n+6 = O(6n+2); 3n°+2n+6 A O(10n+7); 8nt+9n 2# O(100-3)。 加 

在 记 法 f(n)=O(g(n)) 中 ， 除 了 了 (n)=0 以 外 ， 函 数 g(n) 习惯 上 是 单位 项 ( unit term )， 即 一 
个 系数 为 1 的 单项 ， 而 且 通 常 是 令 f(n)=O(g(n)) 为 真 的 最 小 单位 项 。 当 f(n)=0 时 ，g(n)=0。 

例 3-3 用 习惯 的 “大 O” 记 法 描述 例 3-2 的 结果 是 : 10n+7=O(n); 100n3-3=O(n); 
12n+6=O(n); 3n+2n+6 # O(n); 814+H912 # O(n), 大 

在 渐 近 复杂 度 分 析 中 ,我们 要 确定 一 个 最 大 项 以 表示 复杂 度 ， 而 且 把 这 个 最 大 项 的 系数 
置 为 1。 一 个 步 数 函 数 的 单位 项 是 系数 变 为 1 的 项 。 例 如 ，3m?+6nlogn+7n+5 的 单位 项 是 友 
nlogn、n 和 1; 最 大 单位 项 是 ww。 如 果 一 个 程序 的 执行 步 数 是 3n*+6nlogn+7n+5， 那 么 它 的 渐 
近 复 杂 度 是 O(n?)。 
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例 3-4 在 例 2-19 中 ，kan(z) =2n+3。 最 大 单位 项 是 nw， 因 此 tm(n)=O(n)。 

在 例 2-20 中 ，tisum(n) = 2n + 2， 因 此 14swm(n)=O(n)。 

程序 2-19 的 步 数 是 rows + rows + 1 ( 见 图 2-8 )。 最 大 单位 项 是 rows*， 因 此 tiranspose(rows) 
= O(rows’), 国 

注意 ，f(n)=O(g(n)) 与 O(g(n)) =f(n) 不 同 。 实 际 上 ， 后 者 没有 意义 。 使 用 符号 “=” 是 一 
种 遗憾 ， 因 为 这 种 符号 通常 表示 相等 关系 ， 而 我 们 要 表示 的 意思 为 “是 ”"。 因 此 ,我们 要 把 符 
号 “=” 读 作 “是 ”而 不 是 “等 于 "。 

定义 3-2 令 1mn) 和 WU(m,n) 是 两 项 。t(m,n) 渐 近 大 于 U(m,n) (也 可 以 说 U(m,n) 渐 近 小 于 
tm,n) )， 当 且 仅 当 











u (m,n) a Ulm, 12) 
lim nm = 0 limim,n) *% 
u(m, ) 
s n) u(m,n) _ 
lim t(m, 0 关 oo 且 lim < 1mn) 


对 多 于 一 个 变 元 的 步 数 函数 ,“ 大 0” 的 一 个 实用 性 定义 如 下 : 

e 今 f(m,n) 是 一 个 程序 的 步 数 。 其 中 任 一 项 ， 如 果 渐 近 小 于 另 一 项 ， 都 被 去 除 。 
e 把 剩余 项 的 系数 改 为 1。 

例 3-5 考虑 f(m,n)=3mntm+10mn+2m。10mn 渐 近 小 于 3m*xn， 因 为 


Lom = 10 
lim 7 =0 








lim = #£% Elims 


在 其 余 的 项 中 ， 没 有 一 个 渐 近 小 于 另 一 个 。 了 ee 把 剩余 项 的 系数 改 为 1， 我 们 得 
到 f(m,n)=O(m ntm +n’), 国 


3.2.2 渐 近 记 法 Q2 和 @ 


尽管 大 0 记 法 是 最 常用 的 渐 近 记 法 ， 但 是 & 记 法 和 @ 记 法 有 时 也 用 来 描述 程序 的 渐 近 
复杂 度 。 本 节 我 们 给 出 这 两 个 记 法 的 实用 性 定义 。3.3.2 节 和 3.3.3 节 将 给 出 严格 定义 。 

记 法 f(n)=Q(g(n)) ( 读 作 “f(n) is 2 of g(n)”) 表示 /ma) 渐 近 大 于 或 等 于 g(n)。 因 此 ， 在 渐 
近 意 义 上 ，g(n) 是 fln) 的 下 界 。 记 法 f(n)= B(g(n)) ( 读 作 “f(n) is 8 of g(n)” ) 表示 f(n) 渐 近 
等 于 g(n)。 

例 3-6 ”10n+7=Q(n)， 因 为 10n+7 渐 近 等 于 n; 100m-3=Q(m) ; 12n+6=Q(n) ;38+2n46=Q2(n) ; 
Bm +9m = ); 3m+2nt6 # 20D Bnit9m # QW), 

10n+7=B@(n)， 因 为 10n+7 渐 近 等 于 nn; 100n-3=O@(m); 12n+6=O@(n); 3n3+2n+6 # O(n); 
8n*+9n # O(n); 3m+2n+6 # O(n’); Bn'+9n # O(n’), 

因为 tm(n)=2n+3 ( 见 例 2-19 )， 而 且 2n+3 渐 近 等 于 n， 所 以 fm(n)= O(n)。 

因为 fisum(m)=2n+2 ( 见 例 2-20 )， 而 且 2n+2 渐 近 等 于 n， 所 以 tswm(n)= O(n)。 

程序 2-19 的 步 数 是 rows*+rows+1 ( 见 图 2-8 )， 而 且 rows?+rows+1 渐 近 等 于 rows*， 所 以 
liranspose(YOWS)= O(rows’)。 

对 程序 2-1 的 函数 sequentialSearch， 最 好 情况 下 的 步 数 是 4 ( 见 图 2-10 )， 最 坏 情况 下 的 
步 数 是 n+3， 平均 步 数 是 0.6n+3.4。 因 此 ， 最 好 的 渐 近 时 间 复 杂 度 是 6(1)， 最 坏 和 平均 的 渐 
近 时 间 复 杂 度 是 6(n)。 也 可 以 说 ， 函 数 sequentialSearch 的 时 间 复 杂 度 是 Q(1) 和 O(n)， 因 为 
就 步 数 而 言 ，1 是 渐 近 意义 上 的 下 界 ，n 是 渐 近 意义 上 的 上 界 。 
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从 图 2-13 和 图 2-14 可 以 得 到 ，4 三 finsen(n) 过 2n+4。 因 此 tivsen(n) 是 Q(1) 和 O(n)。 胸 
有 时 候 ， 按 照 如 下 方式 解释 O(g(n))、Q(g(m)) 和 OB(g(n)) 是 有 用 的 : 

O(g(n))={f(m)| TCD= OCSCD)} 

Q(g(n))= | fn)= 2080D)} 

O(g(n))={f (|f(n)= O(g(n))} 
基于 这 种 解释 ， 诸 如 O(g1(n))=O(g2(n)) 和 OB(g1(n))= 8(g2(n)) 就 是 有 意义 的 了 。 利 用 这 种 


解释 ， 可 以 很 便利 地 把 f(n)=O(g(n)) 读 作 “fofnis in (or is a member) big oh of g of n”"， 等 等 。 


对 于 理解 本 书 的 性 能 分 析 来 说 ， 渐 近 表 示 法 0O、8 和 9 的 实用 性 定义 都 是 需要 的 。 下 一 


节 是 关于 渐 近 记 法 的 更 严格 的 定义 ， 它 有 助 于 更 复杂 的 性 能 分 析 。 
练习 


ys 


用 


3 


un 上 


-HO 


利用 公式 (3-1 ) 证 明 下 面 的 p(n) 渐 近 大 于 gq(n)。 
1) p(n)=3n+2n’,g(n)= 100n° +6 
2) p(n)=6n'’+12,g(n) = 100n 
3) p(n)=7nlogn,g(n) = 10m 
4) p(n)= 17m2",g(n) = 100n2"+33n 
使 用 大 O 记 法 解释 下 面 的 步 数 。 函 数 g(n) 应 该 是 最 小 的 单元 项 。 
1) 2n: -6n+30 
2 ) 44n'*+33n—200 
3) 1l6n’logn+ Sn 
4) 31m+17n:logn 
5 ) 23n2” -3m 
使 用 大 0 记 法 的 实用 性 定义 和 公式 (3-1 ) 证 明 下 面 的 式 子 : 
1) 2n+7#0(1) 
2) l2n:+8n+7## O(n) 
3) Sm+6n O(n’) 
4) lS5nlogn+16n # O(n’) 


.使 用 8 记 法 表示 练习 2 的 步 数 。 
.使 用 8 记 法 的 实用 性 定义 和 公式 (3-1 ) 证 明 下 面 的 式 子 : 


1) 2n+7# 0Q(n) 

2) 12m+8n+7@#0Q(n) 
3) Sm+6n # Qn logn) 
4) 15mlogn+16n #0Q2(n’) 


. 使 用 @ 记 法 表达 练习 2 的 步 数 。 
. 令 t(n) 是 一 个 程序 的 步 数 。 使 用 渐 近 记 法 表示 下 面 的 步 数 。 使 用 最 合适 的 g(n) 函数 。 


1) 6<1(n) < 20 

2) 6<&1(n) < 2n 

3) 3mr+1<1n) < 4n +3n+9 

4) 3m+1<1t(n)<4nlogn+3n’+9 
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5) 1(n) 2 5n +7 
6) 1(n) 32nlogn+77n-6 
7) 1(n)= 17n’+3n 
8. 使 用 大 0 记 法 表示 下 面 的 步 数 ， 其 中 m 和 n 是 实例 特征 。 
1 ) Tmin + 2m n+ mnt+ Smn’ 
2) 2milogn+3mn+Smlogn+m’n’ 
3 ) m+nm+mn’ 


4) 3mn+7m n+dmnt+8m+2n+16 
3.3 渐 近 数学 ( 可 选 ) 
3.3.1 大 O 记 法 


大 O 记 法 用 来 表示 函数 在 渐 近 增长 率 意义 上 的 上 限 。 

定义 3-3[ 大 O 记 法 ] f(n)=O(g(n))， 当 且 仅 当 存 在 常数 c>0 和 mo， 使 得 对 于 所 有 的 nn 宇 
70, 有 /za) < cg(n)。 

上 述 定 义 表明 ， 除 非 半 小 于 m， 和 否则 函数 /最 多 是 函数 
g 的 c 信 ， 其 中 c 是 一 个 正 的 常数 。 于 是 对 于 足够 大 的 n( 如 
n 宇 fo), 8 是 f 的 一 个 上 限 (最 多 加 一 个 常数 因子 c)。 图 3-4 
说 明 函 数 g(n) 是 函数 /(n) 的 上 限 (最 多 加 一 个 常数 因子 c ) 意 
味 着 什么 。 虽 然 对 的 一 些 值 来 说 ， 函 数 f(n) 可 能 小 于 、 等 
于 ,或 大 于 cg(n), 但 是 一 定 存在 一 个 m 值 ， 当 nn 大 于 m 时 ， 
f(n) 永远 不 会 大 于 cg(n)。 在 大 0 记 法 定义 中 的 no 是 = m 的 任 
意 整数 。 

函数 g 作为 函数 /的 一 个 上 限 ， 形 式 通常 比较 简单 ， 一 般 
只 是 一 个 用 变量 n 表示 的 、 系 数 为 1 的 单项 。 





图 3-4 g(m) 是 f(n) 的 一 个 上 
攻 rv 区 wd Eq 5 
例 3-7[ 线 性 函数 ] 考虑 ftn)=3n+2。 当 nn 二 2 时 ,3n+2 < 。 限 ( 最 多 带 一 个 常量 因子 vc) 


3ntn 反 4n。 因 此 fln)=Om)， 这 时 fln) 的 上 限 是 一 个 线性 函数 。 
同样 的 结论 还 可 以 用 其 他 方法 得 到 。 例 如 ,对 n>0， 有 3n+2 < 10n， 这 时 c=10，no>0。 而 对 


n 宇 1， 有 3n+2 < 3n+2n=5n， 这 时 c=5， ho=1。 在 大 OO 定义 中 , c 和 mo 只 是 用 来 说 明 /fan 和 
g(n) 的 关系 ,它们 具体 是 什么 值 并 不 重要 。 

对 函数 fn)=3n+3， 当 nn 三 3 时 ，3n+3 3ntn < 4n， 因 此 f(n)=O(n)。 类 似 的 ，f(n)= 
100n+6 反 100n+n=101n,，n 三 no=6， 因 此 100n+6=O(n)。 按 照 大 OO 定义 ，3n+2、3n+3 和 100n+6 
都 以 n 的 线性 函数 为 上 限 。 国 

例 3-8[ 平 方 函数 ] 假定 f(n)=10n”+4n+2。 当 nn 三 2 时 , f(n) < 10m+5n。 当 nn 宇 5 时， 
5n < mr。 于 是 当 n 宇 mo=5 时 , f(n) < 10r+m=11mr， 因 此 f(mn)= O(n7)。 

男 一 个 例子 是 f(n)=1000m+100n-6。 显 然 对 所 有 nn， 有/f(n) < 1000m? + 100n。 因 为 对 


n 宇 100,， 有 100n ww， 所 以 对 n 宇 no=100, 有 f(n)<1001mr?。 因 此 f(n)=O(n?)。 国 
例 3-9[ 指数 函数 ] 考虑 f(n)=6*2”+m。 对 n 宇 4， 因为 有 好 三 2?， 所 以 有 mo) < 6*2"+ 
2"=7*2"。 因 此 6*2”"+n?=O(2”)。 加 


例 3-10[ 常量 函数 ] 对 于 常量 函数 J(n)， 比 如 f(m)=9 或 1(m)=2033， 可 以 记 为 f(n)=0(1)。 
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对 这 种 记 法 的 正确 性 ， 很 容易 用 大 O 定义 来 证 明 。 例 如 ,jnD=9 < 9*1， 只 要 令 c=9 以 及 
no=0 即 有 f(n)=O(1)。 同 样 ，f(n)=2033 < 2033*1， 只 要 令 c=2033 以 及 mo=0 即 可 。 加 

例 3-11[ 松散 界限 ] 当 n 三 2 时 ， 有 3n+3 三 3r， 因此 3nt+3=O(mr)。 虽 然 民 是 3n+3 的 
一 个 上 限 , 但 不 是 最 小 上 限 ; 可 以 用 一 个 更 小 的 函数 ( 线性 函数 ) 作为 上 限 ， 即 3n+3=0O(n)。 

当 nn 三 2 时 ，10m+4n+2 过 101， 因此 10m+4n+2=O(n*))。 但 mw 同样 不 是 100m?+4n+2 的 
最 小 上 限 。 

类 似 的 ,6n2"+20=O(m?2"”)， 但 wr2" 不 是 最 小 上 限 , n2" 是 更 小 的 上 限 ， 即 6n2”+ 
20=O(z27)。 加 

在 上 述 推导 的 例子 中 ， 所 用 的 策略 是 : 用 次 数 低 的 项 目 替换 次 数 高 的 项 目 ， 直 到 剩 下 一 
个 单项 为 止 。 

例 3-12[ 错误 界限 ] 3z+2 关 O(1)， 因 为 不 存在 c>0 及 no， 使 得 对 于 所 有 的 nno， 
有 3n+2 志 c。 可 以 用 反 证 法 严格 证 明 这 个 结论 。 假 定 存 在 这 样 的 c 及 no。， 使 得 对 于 所 有 的 
n 宇 no， 有 3n+t2c,， 即 n (c-2)/3。 那 么 当 n>max{no,(c-2)/3} 时 ，3n+2 过 c 就 不 成 立 了 。 

用 反 证 法 证 明 10n*+4n+2 关 O(n)。 假 设 10mn*+4n+2=O(n)， 因 此 存在 一 个 正 数 c 和 no。， 使 
得 对 于 所 有 的 n 三 no， 有 10n+4n+2 < cn。 关 系 式 两 边 同时 除 以 x， 于 是 对 于 所 有 的 n 二 no， 
有 10nt+4+2/n 三 c。 这 个 关系 式 不 总 是 成 立 的 ， 因 为 关系 式 的 左边 随 着 n 的 增长 而 增 大 ， 而 右 
边 保 持 不 变 。 当 nn 三 max {mo, (c-4)/10} 时 ， 关 系 式 不 成 立 ， 即 最 初 假设 不 成 立 。 

用 反 证 法 证 明 f(n)=3m2"+4n2"+8m 关 O(2”)。 假 定 f(n) = 0(2”)， 因 此 ， 存 在 一 个 c>0 
和 no。， 使 得 对 于 所 有 的 nn 三 nop， 有 f(n) < c*2”"。 关 系 式 两 边 同时 除 以 2"?， 于 是 对 于 所 有 的 
nn 三 no， 有 3m+4n+8n”/2” 和 c。 这 个 关系 式 的 左边 随 着 n 的 增长 而 增 大 ,而 右边 是 一 个 常数 。 
因此 对 是 够 大 的 n， 关 系 式 不 成 立 ， 即 最 初 假设 不 成 立 。 加 

如 例 3-11 所 示 ， 关系 式 f(n) = O(g(n)) 仅 表 明 : 存在 一 个 c>0 和 nn。， 对 于 所 有 的 n 宇 mm， 
cg(n) 是 f(n) 的 一 个 上 限 。 它 并 未 表明 该 上 限 是 否 为 最 小 上 限 。 注 意 ， 虽然 关系 式 n=O(n”)， 
n=O(n)，n=O(m) 和 n=0O(2”) 都 是 成 立 的 ， 但 是 为 了 使 关系 式 f(n)=O(g(n)) 具有 实际 意义 ， 
g(n) 应 尽量 地 小 。 因 此 常用 的 关系 式 是 3n+3=O(n)， 而 不 是 3n+3=O(n”))， 尽 管 后 者 也 是 正 
确 的 。 

当 f(n) 是 一 个 n 的 多 项 式 时 ， 定 理 3-1 对 关系 式 f(n)=O(g(n)) 中 的 g(n) 给 出 了 一 个 非常 
有 用 的 结论 。 

定理 3-1 如 果 f(n)=amn”"+… +aintao 且 am>0， 那 么 f(n)=0O(n”)。 

证 明 fn) <Zlaln < "Ylaln”™” < n" Ylal ，h 宇 1。 因此 ，f(n) = O(n") 加 


例 3-13 把 定理 3-1 应 用 到 例 3-7、 例 3-8 和 例 3-10。 例 3-7 的 三 个 线性 函数 都 有 m=1， 
因此 它们 均 是 O(n)。 例 3-8 的 多 项 式 f(n) 都 有 m=2， 因 此 它们 均 为 O05。 例 3-10 的 两 个 常 
量 函数 有 m=0， 因 此 它们 是 0(1)， 即 O(z9)。 加 

例 3-12 的 策略 可 以 扩充 ， 以 表明 一 个 满足 大 O 定义 的 上 限 ， 未 必 是 满足 需要 的 上 限 。 这 
正 是 定理 3-2 的 内 容 。 这 个 定理 通常 要 比 大 O 定义 更 容易 说 明 f(n)=O(g(n)) 的 意义 。 

定理 3-2[ 大 O 比率 定理 ] 假设 函数 f(n) 和 g(n) 有 极限 limfl(n)/g(n) 存在 ， 那 么 关系 式 
Jf(nm)=O(g(n)) 成 立 ， 当 且 仅 当 存 在 常数 c， 使 limfln)/g(n) < c。 

证 明 阁 f(n)=O(g(n))， 则 存在 c>0 及 n。， 使 得 对 所 有 的 n 三 nop， 有 fln)/g(n) < c， 因 此 
limflm)/g(n) < c。 反 过 来 ， 若 limfln)/g(n) < c， 则 存在 一 个 np， 使 得 对 于 所 有 n 三 mm， 有 
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Ja < max{l,c}*g(n)。 县 

例 3-14 因为 lim(3n+2)/n=3， 所 以 3n+2=O(n)。 因 为 lim(10mw+4n+2)/m=10， 所 以 
10m+4n+2= O(n)。 由 lim(6*2"+1)/2"= 6， 得 知 6*2*+ 忱 =0O(2”) 成 立 。 由 lim(2n? -3)/n*=0， 
得 到 2m-3 = O(n )。 因 为 lim(3m +5)/m=o0， 赦 3m+5 关 O(n)。 | 男 


3.3.2 只 记 法 


2 记 法 与 大 O 记 法 类 似 ， 它 表示 的 是 函数 在 渐 近 增长 率 意 义 上 的 下 限 。 

定义 3-4[Q 记 法 ] f(n)=Q(e(n)) 当 且 仅 当 存在 常数 c>0 和 mm， 使 得 对 所 有 的 于 三 m， 有 
f(n) = cg(D)。 

由 了 (n)=Q(g(n)) 的 定义 可 知 ， 除 非 小 于 no。， 否 则 函数 至少 是 函数 g 的 c 信 ， 其 中 c 是 
一 个 大 于 0 的 常数 。 因 此 ， 对 足够 大 的 n( 如 三 1m0), g 是 f 的 
一 个 下 限 (最 多 加 一 个 常数 因子 c)。 图 3-5 说 明 函 数 g(m) 是 函 Pm 
数 f(n) 的 下 限 (最 多 加 一 个 常数 因子 c) 意味 着 什么 。 虽 然 对 光 
n 的 一 些 值 来 说 ,函数 /(n) 可 能 小 于 、 等 于 ， 或 大 于 cg(n), 但 
是 一 定 存 在 一 个 m 值 ， 当 nn 大 于 m 时 , f(n) 永 远 不 会 小 于 
cg(n)。 记 法 定义 中 的 mw 是 宇 m 的 任意 整数 。 

与 大 O 记 法 的 应 用 一 样 ， 通 常 使 用 的 仅 是 单项 形式 的 g 

















函数 。 ， 和 

例 3-15 对 于 所 有 的 x， 有 f(m)=3n+2>3n， 因 此 f(n)= ” : 
Q(n)。 同 样 ， 由 了 (n)=3n+3>3n， 得 知 f(n)=Q(n)。 因 f(n)=100n+ Re 
6>100n， 所 以 100n+6=Q(n)。 因 此 ，3n+2、3n+3 和 100n+6 都 图 3-5 g(m) 是 f(n) 的 一 个 下 限 
以 线性 函数 为 下 限 。 ( 最 多 加 一 个 常数 因子 ) 


对 于 所 有 的 rn 三 0， 有 Jf(n)=10m+4n+2>10mwr， 因 此 f(n)=Q(m)。 同 样 ，1000n*+100n- 
6=Q(m")。 由 于 6*2"+m?>6*2”"， 所 以 6*2"4H72=2(27)。 

还 有 ，3n+3=Q(1); 10n? + 4n+2= 0(n); 10n+ 4n+2= Q(1); 6*2"+n = Q(n1"); 6*2"+n = 
O(n); 6*2"+1 =Q(n); 6*2"+1 =Q(n) 和 6*2"+n =Q(1), 

为 了 理解 3n+2 寺 Q(m)， 可 以 用 反 证 法 。 先 假设 关系 式 3n+2=Q(m) 成 立 。 因 此 存在 正 
数 c 和 no。， 使 得 对 于 所 有 的 n 三 no。， 有 3n+2 三 crm， 即 有 cnY(3n+2) < 1。 但 是 这 个 不 等 式 不 
可 能 总 成 立 ， 因 为 不 等 式 的 左边 的 表达 式 随 着 的 增 大 而 增 大 ， 以 至 无 限 。 这 说 明 假 设 不 对 ， 
原 式 正确 。 国 

与 大 O 记 法 的 情形 一 样 ， 存 在 若干 个 函数 g(n) 满足 f(n)=Q(g(n))， 其 中 g(n) 仅 是 f(n) 的 
一 个 下 限 (最 多 加 一 个 常数 因子 )。 为 了 让 关系 式 f(n)=Q2(g(n)) 有 价值 ，g(n) 应 该 足够 大 。 因 
此 常用 的 是 3n+3=Q(n) 及 6*2"+n "=2(2")， 而 不 是 3n+3=Q2(1) 及 6*2"+n "=Q2(1)， 尽 管 后 者 也 是 
正确 的 。 

定理 3-3 是 与 定理 3-1 类 似 的 一 个 关于 8 记 法 的 定理 。 

定理 3-3 如 果 f(n)=amn” +… +aintao 且 aw>0， 则 f(n)=Q(n”)。 


证 明 见 练习 12。 咽 
例 3-16 由 定理 3-3 可 知 ，3n+2=Q2(n) ; 10m+4n+2=Q(n?) ; 100n*+3500n*+82n+8= 人 2(n')。 
转 


定理 3-4 是 与 定理 3-2 类 似 的 一 个 定理 ， 采 用 定理 3-4 通常 要 比 采 用 只 定义 更 容易 证 明 
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f(n) = 2(g(n))o 

定理 3-4[Q2 比率 定理 ] 假设 函数 /az 和 8(z 有 极限 limg(D)Ma) 存在 ， 那 么 关系 式 
Jf(m)=Q(g(n)) 成 立 ， 当 且 仅 当 有 常数 c， 使 limg(m)/f(n) < c 成立。 

证 明 见 练习 13。 男 

例 3-17 因为 lmn/(3n+2)= 1/3， 所 以 3n+2=Q(n); 因为 limn/(10m*+ 4n+2)=0.1， 所 以 
10m+4n+2=Q(m)。 因 为 lim2"/(6*2"+m)=1/6， 所 以 6*2"+m=22(2") ; 因为 limn/(6m*+2)=0， 
所 以 6242-=200); 因为 limn /3m +5)= oo， 所 以 3m+5 天 Q0D)。 


3.3.3 日 记 法 


9 记 法 用 来 表示 了 的 上限 和 下 限 都 是 一 个 函数 时 的 情况 。 

定义 3-5[@ 记 法 ] f(n)=O@(g(n))， 当 且 仅 当 存 在 常数 c1>0，cs>0 和 no， 使 得 对 于 所 有 的 
n 宇 no， 有 cig(n) < f(n) < csg(n), 

定义 f(n)=B(g(n)) 表明 ， 除 非 n 小 于 no， 否 则 函数 至少 是 函数 g 的 cl 售 ， 至 多 是 函数 g 
的 c 倍 ， 其 中 cl 和 c 是 大 于 0 的 常数 。 因 此 对 于 所 有 足够 大 的 n (如 n 宇 no)，g 既是 f 的 上 
限 也 是 f 的 下 限 (最 多 加 一 个 常数 因子 )。 对 9 记 法 的 男 一 种 观点 是 ，f(n) 既是 Q(g(n)) 又 是 
O(g(n))。 

图 3-6 说 明 函 数 g(n) 既是 f(n) 的 上 限 也 是 fn) 的 下 限 
(最 多 加 一 个 常数 因子 ) 意味 着 什么 。 一 定 存在 一 个 m 值 ， 
当 n 大 于 m 时 , f(n) 介 于 cig(n) 和 cg(n) 之 间 。9 记 法 定 
义 中 的 加 是 三 m 的 任意 式 数 。 

与 大 O0 记 法 和 只 记 法 的 应 用 一 样 ， 我 们 通常 仅 使 用 
单项 形式 的 g 函数 。 

例 3-18 从 例 3-7、 例 3-8、 例 3-9 和 例 3-15 可 以 得 
到 : 3n+2=O(n); 3n+3=O(n); 100n+6=O(n); 10m+4n+2 = 
O(n); 1000n’+100n-6=O(n"); 6*2"+n =O(2"), i 

对 nn 三 16， logzn<10*logzn+4 夺 11l*logzn,， 因 此 全 
10*logzn+4=@(logzn)。 前 面 曾 提 过 logsn 等 于 1ogsn 的 一 图 3-6 _g(m) 既是 fm) i 
个 常数 倍 ， 因 此 可 以 把 6(logsn) 简写 为 e(log)。 De 

在 例 3-12 中 证 明了 3nt2 关 O01)， 因 此 3nt2z 关 BO(1)。 同 样 有 3n+3 BO(1)，100n+ 
6 关 BO(1)。 因 为 3n+3 关 2Q7)， 所 以 3nt3 天 O(tr)。 因 为 10m+4n+2 关 O(n)， 所 以 10m+4nt+ 
2 关 O(n)。 因 为 10n*+4n+2 天 O(1)， 所 以 10m+4n+2 关 @(1)。 加 

因为 6*2”+17 关 O0 门 ， 所 以 6*2"+Hr 产 BO(r))。 同 理 ,，6*2"+47 O(n)，6*2" + 关 O(1)。 

正如 前 面 所 提 到 的 ， 在 实际 应 用 中 ， 仅 使 用 系数 为 1 的 g 函数 。 因 此 几乎 从 来 不 用 
3n+3=O(3n)， 或 10=O(100)， 或 10n?+4n+2=Q(4n”), 或 6*2”+ 12=Q(6*27)， 或 6*2"412=@(4*2")， 
即使 这 些 表 达 式 都 是 正确 的 。 

定理 3-5 ”如果 f(n)=awmn”+… +aintao 且 am>0， 则 f(n)=O@(n")。 

证 明 见 练习 12。 国 

例 3-19 根据 定理 3-5，37z+2=@(z)，10712+471+2=@(UD2]，100m44+3500122+827+8=GU2)。 国 
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定理 3-6 与 定理 3-2 和 定理 3-4 类 似 。 

定理 3-6[@ 比率 定理 ] 假设 fln) 和 g(n) 有 极限 limfln)/g(n) 和 limg(m)/ftn) 存在 ， 那 
么 关系 式 f(n)= O(g (n)) 成立， 当 且 仅 当 存 在 常数 c, 使 limfln)/g(n) <c 及 lmg(W)/f(n)<e 

证 明 见 练习 13。 国 

例 3-20 因为 limG3n+2)/mn=3 且 limn/(3n+2)=1/3<3， 所 以 3n+2= 6B@(n); 因 
为 lim(10n*+4n+2)/m=10 自 limn/(l0m +4n+2)=0.1<10, 所 以 10m+ 4n+2= O(n); 
因 为 lim(6*2"+n)/2"=6 且 lim2”/(6*2"+n)=1/6<6, 所 以 6*2"+m= GO@(2"); 因为 
lim(6m*+2)/n= oo， 所 以 6n°+2 # O(n)。 国 


3.3.4 小 o 记 法 


对 函数 yj 的 渐 近 增长 比率 ,小 o 记 法 给 出 了 严格 的 上 限 。 简 单 地 讲 ，f(n)=o(g(n))， 当 和 且 
仅 当 fn) 渐 近 小 于 g(n) (回忆 一 下 了 (n)=o(g(n) )， 当 和 且 仅 当 f(n) 渐 近 小 于 或 等 于 g(n)。 

定义 3-6[ 小 o 记 法 ] f(n)=o(g(m))， 当 且 仅 当 f(n)= O(g(n)) 且 f(n) ¥ 2(g(n))。 

例 3-21[ 小 o 记 法 ] 因为 3n+2=O(n”) 且 3n+2 关 Q(m)， 所 以 3n+2=o(m*))。 但 3n+2 关 
o(n)。 同 样 ，10m*+4n+2=o(m),， 但 10n?+4n+2 天 o(n”)。 图 

小 o 记 法 经 常用 于 步 数 分 析 。 步 数 为 3nto(n)， 意 思 是 步 数 相当 于 3n 加 上 一 个 渐 近 值 小 
于 的 值 。 当 分 析 步 数 时 ， 程 序 中 其 步 数 小 于 @(n) 的 部 分 就 可 以 省 略 。 


3.3.5 ”特性 


下 面 的 定理 可 用 于 渐 近 记 法 的 计算 。 

定理 3-7 对 于 任意 一 个 实数 x>0 和 任意 一 个 实数 >0， 下 面 的 结论 都 是 正确 的 : 
1 ) 存在 某 个 np， 使 得 对 于 任何 n 三 np， 有 (logn)x<(logn)”*。 

2 ) 存在 某 个 no， 使 得 对 于 任何 中 三 加， 有 (logn)x<n'。 

3 ) 存在 某 个 no。， 使 得 对 于 任何 hn 宇 nno， 有 wn <n™*。 

4 ) 对 于 任意 实数 y， 存 在 某 个 ho， 使 得 对 于 任何 n 宇 nop， 有 ni'(logn)<n™*。 

5 ) 存在 某 个 no， 使 得 对 于 任何 n 宇 no， 有 <2”。 


证 明 ”可 参考 各 个 函数 的 定义 。 国 
例 3-22 ”根据 定理 3-7， 可 以 得 到 如 下 结论 : 产 +Plogna=@0D) ; 对 于 每 一 个 自然 数 k， 有 
2"/m=Q(n"); mtn log"n=O(n"); 2"nlogint2"ni /logn=O(2"n‘login), 国 


关于 O、8 和 日 记 法 ,图 3-7 列 出 了 一 些 最 常用 的 等 式 ， 其 中 除 n 以 外 所 有 符号 均 代表 
正 的 常数 。 图 3-8 是 关于 和 与 积 的 一 些 推理 原则 。 

要 用 渐 近 记 法 来 描述 程序 的 时 间 复 杂 度 (或 步 数 )， 你 应 该 具备 图 3-7 和 图 3-8 的 
知识 。 

0O、Q、9 和 0o 的 定义 可 以 推广 到 多 变量 函数 。 例 如 ，f(n,m)=O(g(n,m))， 当 且 仅 当 存 在 正 
常数 c、no 和 mo， 使 得 对 所 有 n 三 no 和 m 宇 mo， 有 f(n,m) < cg(n,m) 成 立 。 


_ 丰 党 一 琐 从 预 交 关注  _ . 





@(Vn(n/e)") 





@(logn) 








@ 可 以 表示 O、2 和 @ 中 的 任何 一 个 
图 3-7 渐 近 等 式 


{fn) =© 0)} 10 =0 (De) 

{J0) =@ B00)),1 <1< A -Pf = (mean {gD 

{0 = (01 <i<H -1/0 -0 (le) 

{f.0) = O(@ 0) fln) = Og:(n)} = fi(n) +fi(n) = Ogi(n) + ga(n) 
{J 0) = Og An) = Qg:00)} = FOD) +f(n) = Qn) + gn) 


{fi(n) = O(gn)f(n) = (gn)} = fn +f(n) = O(g(n)) 





图 3-8 关于 旬 的 推理 规则 ( @@E€ {0, 2, 9} ) 


练习 


9. 使 用 0O、88、98 和 o 的 定义 之 一 ， 证明 下 列 等 式 的 正确 性 。 不 用 定理 3-1 至 定理 3-6， 也 不 
用 图 3-7 和 图 3-8。 
1) Sn -6n= O(n’) 
2) n!l= O(n") 
3) 2n’2"+nlogn = O(n’2") 


4) 和 P =O(z) 


5) Hi= O(n) 
i=0 
6) n”"+6*2"= O(n") 
7) n+10°n= O(n) 
8) 6n'/(logn+1)= O(n’) 
9) n+nlogn= O(n") 
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10) m+ nlogn= O(n), k= 0 有 e>0 
10. 使 用 定理 3-2、 定 理 3-3 和 定理 3-6， 完 成 练习 9。 
11. 证 明 下 列 等 式 不 正确 : 
1) 10n’°+9= O(n) 
2) nlogn= O(n’) 
3) n’/logn= O(n’) 
4) n2"+6n3"= O(n2") 
12. 证 明定 理 3-3 和 定理 3-5。 
13. 证 明定 理 3-4 和 定理 3-6。 
14. 证 明 等 式 f(n)=o(g(n)) 成 立 ， 当 上 且 仅 当 limfln)/g(n)=0。 
15. 证 明 图 3-7 的 等 式 E5 ~ E8。 
16. 证 明 图 3-8 的 推理 规则 11~16。 
17. 下 面 的 推理 规则 哪 一 个 是 正确 的 ?为 什么 ? 
1) {fl(n)= O(F(n)),g(n) = O(G(n)} — fln)/g(n) = O(F(n)/G(n)) 
2) {f(m = O(F(n)),g(n) = O(G(n)} = fn) /gn) = QF(N)/Gn)) 
3) {fn = O(F(n),g(n) = O(G()} = fin)/g(n) = O(F(n)/Gn)) 
4) {fl(m = Q(F(n)),8(n) = Q(G)} = fn) /gn) = QF(n)/Gn)) 
5) {f(m) = Q(F(n)),g(n) = Q(G(n)} — fn)/g(n) = OF(n)/G(n)) 
6) {f(m = Q(F(n)),gn) = (Gm))} — fn)/g(n) = OF(n)/Gn)) 
7) {fln = O(F(n),g(n) = O(G(n))} — fn)/g(n) = O(F(n)/Gn)) 
8) {fln)=O(F(n)),g(n) = 0(G(n))} — fln)/g(n) = QF(n)/G(n)) 
9) {f(n =O(F(n)),g(n) = O(G(m))} — fn)/g(n) = O(F(n)/G(n)) 


3.4 ”复杂 度 分 析 举 例 


在 3.2 节 ， 对 于 若干 个 例子 ， 我们 从 步 数 的 计算 开始 ， 然 后 逐步 到 渐 近 复杂 度 的 分 析 。 
实际 上 ,不 用 精确 地 计算 步 数 ， 也 可 以 很 容易 地 得 到 渐 近 复杂 度 。 步 骤 是 ， 先 确定 每 一 条 语 
句 或 一 组 语句 的 渐 近 复杂 度 ， 再 把 它们 加 起 来 。 图 3-9 ~ 图 3-12 是 若干 个 相应 的 例子 ， 它 们 
的 前 提 是 : 如 果 fi(n)=O(gi(m)) 和 fp(n)=@(gz(n))， 那么 fi(n)+f(n)=O@(max{g1(n),82(m)})。 


TT Sum(T all;y int ny) 


{ 
T theSum 
for (int 
theSum += a[i]:; 


return theSum; 








funn)= O(max {gi(n)})=O(n) 
图 3-9 程序 1-30 的 函数 sum 的 渐 近 复杂 度 
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void transpose(T **a, int rows) @(0) 
{ ©(0) 


fOr (int I ; i < rows; i++) rows+l O(rows) 
for {int j = i+l; j < rows; j++) rows(rows+1)/2 O(rows’) 
swapla[li][j], alj] {i]); rows(rows—1)/2 O(rows’) 

0 G(0) 





Tiranspose(rOWS)= OUows5 


图 3-10 程序 2-19 的 函数 transpose 的 渐 近 复杂 度 


VoLd Lneft (TT akls T Blj, int n) 0 0 
0 0 
1 n+l 
2+6 n 
0 0 


{ 
Tned(n)= GOD) 
图 3-11 程序 2-20 的 函数 inef 的 渐 近 复杂 度 











fe6¥ (lint 可 = 各 DT < hy 1+*) 






b[j] = sum(a, 本 + 1)y 






int sequentialSearch(T al], int n, const T& x) (0) 
{ @(0) 
int E> 1 @(1) 


for {i= O07 EE <n Ce ali] l= Xr 主 直 十) 2(1), O(n) 2(1), O(n) 

if (i == n) return -1; 1 ©(1) 

else return i; £20), O(1) Q(0), 0(1) 
0 G(0) 





tsequentialSearch( 1)= Q( 1 ) TsequentialSearch( 1 )= O(n) 


图 3-12 程序 2-1 的 函数 sequentialSearch 的 渐 近 复杂 度 


对 图 3-9 ~ 图 3-12 的 分 析 实 际 上 是 根据 执行 步 数 进行 的 但是， 每 一 步 的 执行 时 间 仅 为 
8(1)， 因 此 ， 可 以 把 tp(n)=B@(g(n))，ip(n)=O(g(n))， 或 者 ip(n)=Q(g(n)) 作为 语句 ， 用 以 计算 程 
序 PP 的 运行 时 间 。 

通过 对 图 3-9 ~ 图 3-12 的 分 析 ， 就 有 了 经 验 ， 进 而 可 以 更 全 面 地 考察 程序 的 渐 近 复杂 度 。 
下 面 用 几 个 例子 来 详细 地 阐述 这 种 方法 。 

例 3-23[ 排 列 ] 考虑 程序 1-32 的 排列 方法 permutation。 假 设 m=n-1。 当 km 时， 
所 需 时 间 为 cx， 其 中 c 是 一 个 常数 。 当 k<m 时 ， 执 行 else 语 句 ， 此 时 , for 循环 执行 

m-ktl1 次 。 每 次 循环 所 需 时 间 为 dfpermuaiions(Kt1,m))， 其 中 4d 是 一 个 常数 。 因 此 ， 当 cm 时 ， 
fpermutations(k1)=(1m 一 K+)tpermutations(K+1,m)。 通 过 置换 得 到 ;focrrmaions(0,m)=O((1nt1)*(nzt1)1)=O@(n*nl)。 

例 3-24[ 折 半 查找 ] 程序 3-1 的 函数 是 在 一 个 有 序数 组 中 查找 元 素 x。 与 STL 的 算法 
binary_search 非常 类 似 。 变 量 left 和 right 分 别 表 示 搜 索 段 的 左右 两 个 端点 。 开 始 时 ， 在 0 到 
71-1 之 间 进 行 查找 ， 因 此 left 和 right 的 初 值 分 别 为 0 和 n-1。 在 查找 过 程 中 ,保持 不 变 的 是 : 
x 是 数组 a[0:n-1] 的 元 素 ， 当 且 仅 当 x 是 afleft:right] 的 元 素 。 
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程序 3-1 折 半 查找 
template<class T> 
int binarySearch(T al[l], int n, const T& x) 
{// 在 有 序数 组 a 中 查找 元 素 x 
1/ 如 果 存 在 ， 就 返回 元 素 x 的 位 置 ， 否 则 返回 -1 


Dnt Let = Vy /数据 段 的 左 端 
int right 三 五 一 1; /数据 段 的 右 端 
While (left <= right) { 
int middle = (left + right)/2; /数据 段 的 中 间 
if (x == a[lmiddle]) return middle; 


if (x > a[lmiddle]) left = middle + 1; 
else right = middle - 1; 
} 
return -1; 1// 没有 找到 x 
} 


查找 过 程 从 x 与 搜索 段 的 中 间 元 素 的 比较 开始 。 如 果 x 等 于 中 间 元 素 ， 则 查找 过 程 结 束 。 
如 果 x 小 于 中 间 元 素 ， 则 仅 需 要 查找 搜索 段 的 左 半 部 分 ， 因 此 right 被 修改 为 middle-1。 如 果 
x 大 于 中 间 元 素 ， 则 仅 需 要 查找 搜索 段 的 右 半 部 分 ， 这 时 ，left 将 被 修改 为 middle+1。 

while 循环 的 每 一 次 迭 代 ( 最 后 一 次 除外 ) 都 将 以 减 半 的 比例 缩小 搜索 的 范围 ， 因 此 该 循 
环 在 最 坏 情 况 下 的 执行 次 数 是 (logn)。 因 为 每 次 循环 需 耗 时 86(1)， 所 以 在 最 坏 情况 下 ， 总 的 
时 间 复 杂 度 是 @(logn)。 大 

例 3-25[ 插 入 排序 ] 程序 2-15 的 插入 排序 对 象 是 nn 个 元 素 。 对 于 i 的 每 个 值 ， 最 内 
部 的 for 循环 在 最 坏 情况 下 的 时 间 复 杂 度 为 9(i)， 因 此 ， 程 序 2-15 的 时 间 复 杂 度 ， 最 坏 为 
OO(1+2+3+…+n-1)=B(m)， 最 好 是 @(n)。 国 


练习 


18. 计算 以 下 函数 的 渐 近 复杂 度 ， 建 立 一 个 类 似 于 图 3-9 ~ 图 3-12 的 频率 表 。 
1 ) factorial ( 见 程序 1-29 ) 
2 ) minmax( 见 程 序 2-24 ) 
3 ) minmax( 见 程 序 2-25 ) 
4 ) matrixAdd ( 见 程序 2-21 ) 
5 ) squareMatrixMultiply( 见 程序 2-22 ) 
6 ) matrixMultiply ( 见 程序 2-23 ) 
7 ) indexOfMax ( 见 程序 1-37 ) 
8 ) polyEval ( 见 程序 2-3 ) 
9 ) horner ( 见 程 序 2-4 ) 
10 ) rank( 见 程序 2-5 ) 
11 ) permutations( 见 程 序 1-32 ) 
12 ) selectionSort ( 见 程序 2-7 ) 
13 ) selectionSort ( 见 程序 2-12 ) 
14 ) insertionSort ( 见 程序 2-14 ) 
15 ) insertionSort ( 见 程序 2-15 ) 
16 ) bubbleSort ( 见 程序 2-9 ) 
17 ) bubbleSort ( 见 程 序 2-13 ) 
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3.5 ”实际 复杂 度 


我 们 已 经 知道 ， 一 个 程序 的 时 间 复 杂 度 通常 是 其 实例 特征 的 函数 。 在 确定 程序 的 时 间 
需求 是 如 何 随 着 实例 特征 的 变化 而 变化 时 ， 这 种 函数 非常 有 用 。 我 们 也 可 以 利用 这 种 函数 
对 两 个 功能 相同 的 程序 已 和 2@ 进行 比较 。 假 定 程 序 P 的 复杂 度 是 9(n)， 程序 2 的 复杂 度 是 
B@(mr)， 由 此 可 以 断定 ， 对 于 “足够 大 ”的 n， 程序 P 比 程序 0O 快 。 为 了 说 明 这 种 判断 的 正 
确 性 ， 让 我 们 进行 一 次 实际 的 计算 。 对 于 某 些 常量 c 和 所 有 的 n 三 n1， 程序 PP 的 时 间 上 限 为 
cn ; 对 于 某 些 常 量 4 和 所 有 的 n 二 n,， 程 序 2 的 时 间 下 限 为 dm?。 由 于 对 于 所 有 n 宇 c/4， 有 
cn dm, 因此 每 当 n 宇 max{m,n2,c/d} 时 ,程序 P 比 程序 OQ 快 。 

对 上 述 判 断 所 使 用 的 “足够 大 ”的 概念 ， 我 们 要 始终 关注 它 的 意义 。 在 对 两 个 程序 进行 
取舍 的 时 候 ， 必 须 清 楚 实 例 特征 n 是 否 真 的 足够 大 。 如 果 程 序 P 的 实际 运行 时 间 为 10% 毫秒 ， 
而 程序 2 的 实际 运行 时 间 为 er 毫秒 ， 并 且 ， 如 果 总 有 n < 10;， 那 么 优先 使 用 的 将 是 程序 C。 

为 了 感知 各 种 函数 是 如 何 随 着 n 的 增长 而 变化 的 ， 可 以 仔细 地 研究 图 3-13 和 图 3-14。 从 
图 中 可 以 看 出 ， 随 着 n 的 增长 ，2” 的 增长 极 快 。 事实 上 ， 如 果 程 序 的 执行 步 数 是 2"， 那 么 当 
n=40 时 ， 执 行 步 数 将 大 约 为 1.1*102。 在 一 台 每 秒 执行 1 000 000 000 步 的 计算 机 上 ， 该 程序 
大 约 需要 执行 18.3 分 钟 。 如 果 n=50， 同 样 的 程序 在 该 计算 机 上 需要 执行 13 天 。 当 n=60 时 ， 
需要 执行 310.56 年 。 当 n=100 时 ， 则 需要 执行 4*+10 年 。 因 此 可 以 断定 ， 一 个 程序 的 复杂 度 
如 果 是 指数 级 ， 那 么 它 的 实例 特征 n 就 必须 限制 在 适度 小 的 范围 (一 般 是 n < 40 )。 
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图 3-14 各 种 函数 的 测算 图 
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一 个 函数 的 复杂 度 如 果 是 高 次 多 项 式 ， 那么 它 也 必须 限制 使 用 。 例 如 ， 若 程序 的 执行 步 
数 是 n*， 那 么 当 n=10 时 ， 每 秒 执行 1 000 000 000 步 的 计算 机 需要 10 秒 钟 ; 当 n=100 时 , 需 
要 3171 年 ; n=1000 时 ， 需 要 3.17*10" 年 。 如 果 程 序 的 复杂 度 是 台 ， 则 当 n=1000 时 ， 需 要 
执行 1 秒 ; 当 n=10 000 时 ,需要 110.67 分 钟 ; 当 100 000 时 , 要 11.57 天。 

图 3-15 是 复杂 度 为 f(n) 的 程序 在 每 秒 1 000 000 000 条 指令 的 计算 机 上 的 运行 。 目 前 只 
有 世界 上 最 快 的 计算 机 才能 每 秒 执行 1 000 000 000 条 指令 。 从 实际 应 用 来 看 ， 对 于 相当 大 的 
n (比如 n>100 )， 只 有 那些 复杂 度 比 较 小 ( 如 nn、nlogn、rr、r ) 的 程序 才 是 可 行 的 。 即 使 
能 够 制造 出 每 秒 10" 条 指令 的 计算 机 ， 情况 也 是 如 此 。 如 果 有 这 样 的 计算 机 ， 图 3-15 的 计算 
时 间 将 分 别 减 小 1000 倍 。 当 n=100 时 ， 执 行 n" 条 指令 需 耗 时 3.17 年 ， 执 行 2" 条 指令 需 耗 
时 4*10" 年。 
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.03hs : 10hs 

.09HSs S 160hs 2.84h 

.1Shs .9Hs 810hs 6.83d 

.21HS 2.56ms 121d 

.28Hs 6.25ms 3.1y 

.66hs 100ms 3171y 4*103y 


9.96hs 16.67m 3.17*103y | 32*1028y 


130hs 115.7d 3.17*102y 
1.66ms 3171y 3.17*1033y 
19.92ms 3.17*107y 3.17*10%y 





1 微 秒 (hs)=10* 秒 1 毫秒 (ms ) =10- 秒 
s= 秒 。 m= 分 钟 ”h= 小 时 d= 天 y= 年 
图 3-15 在 一 台 每 秒 1 000 000 000 条 指令 的 计算 机 上 的 运行 时 间 


练习 


19. 令 4 和 B 是 功能 相同 的 程序 。i(n) 和 ts(n) 分 别 表示 它们 的 运行 时 间 。 对 于 下 面 的 每 一 对 
数据 ， 确 定 n 的 取 值 范围 ， 使 程序 4 在 这 个 范围 中 比 程 序 B 要 快 。 
1 ) t4(n)=1000n, ts(n)=10r 
2 ) t4(n)=2m, tg(n)=m 
3 ) 14(n)=2”, ts(n)=100n 
4 ) 14(n)=1000nlog2n, ts(n)=n? 
20. 假定 一 台 计 算 机 每 秒 能 执行 1 万 亿 条 指令 ， 重 新 给 出 图 3-15 的 数据 。 
21. 假定 有 一 个 程序 和 一 台 计 算 机 ， 它 们 可 以 在 “合理 的 时 间 ” 内 解决 规模 为 n=N 的 问题 。 
” ”用 一 个 表格 来 说 明 ， 用 同样 的 程序 和 速度 快 + 倍 的 计算 机 ， 能 够 在 “合理 的 时 间 ” 内 解 
决 问题 的 最 大 规模 是 多 少 ( 即 最 大 的 n 值 )。 分 别 取 x=10、100、1000 和 1000000 以 及 
ft4(n)=n、n*、n”、n’ 和 2” 来 完成 练习 。 
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3.6 参考 及 推荐 读物 


下 面 的 参考 书包 含 若 干 个 程序 的 渐 近 复杂 度 分 析 : 
1 ) E. Horowitz, S. Sahni, S. Rajasekaran. Fundamentals of Computer Algorithms. W. H. Freeman, 
New York, NY, 1998. 
2 ) T. Cormen, C. Leiserson, R. Rivest. Introduction to Algorithms. 2nd ed. McGraw-Hill, New 
York, NY, 2002. 
3 ) G. Rawlins.Compared to What: An Introduction to the Analysis of Algorithms. W. H. Freeman, 
New York, NY, 1992. 
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Data Structures, Algorithms, and Applications in C++, Second Edition 


性 能 测量 





概述 


要 知道 梨子 的 滋味 ， 就 要 亲口 尝 一 尝 。 你 要 把 应 用 软件 推销 给 客户 ， 就 要 让 客户 知道 这 
个 软件 需要 多 少 内存 和 和 运行 时 间 。 对 内 存 的 需求 容易 处 理 ， 只 要 知道 编译 后 的 代码 和 数据 空 
间 的 大 小 就 可 以 了 ; 其 中 ， 数 据 空 间 的 大 小 取决 于 用 户 所 要 解决 的 问题 实例 的 大 小 。 而 要 确 
定 程 序 运 行 时 间 ， 你 就 要 通过 实验 来 测量 。 这 一 章 就 是 讨论 实验 测量 的 步骤 。 

程序 性 能 不 仅 依赖 操作 类 型 和 数量 ， 而 且 依赖 数据 和 指令 的 内 存 模 式 。 计 算 机 内 存 是 有 
等 级 之 分 的 ， 例 如 ，L1 高 速 缓存 、L2 高 速 缓存 和 主 存 。 内 存 横 式 不 同 ， 访 问 时 间 也 就 不 同 。 
一 个 程序 ， 操 作 计数 很 大 ， 但 访问 低速 内 存 的 数量 很 小 ， 另 一 个 程序 ， 操 作 计数 不 大 ， 但 访 
问 低速 内 存 的 数量 不 小 ; 结果 前 者 可 能 比 后 者 快 。 这 个 现象 可 以 用 矩阵 乘法 问题 来 说 明 。 


性 能 测量 ( performance measurement ) 关注 的 是 一 个 程序 实际 需要 的 空间 和 时 间 。 如 前 
所 述 ， 这 些 数据 不 仅 与 特定 的 编译 器 及 编译 器 选项 相关 ， 还 与 计算 机 相关 。 就 计算 机 而 言 ， 
本 书 的 所 有 性 能 值 ， 除 非特 别 声明 ， 都 是 在 英特尔 奔腾 4 处 理 咒 (1.7GHz，512MB 的 随机 存 
储 器 ) 的 PC 上 ， 用 Microsoft Visual Studio. NET 2003 获得 的 。 时 间 优 化 的 代码 由 下 面 的 语句 
产生 : 


#program optimize("t",on) 


我 们 忽略 编译 所 需 的 时 间 和 空间 ， 这 是 因为 每 一 个 调试 后 的 程序 仅 需 要 编译 一 次 ， 然 后 
可 以 运行 若干 次 。 不 过 ， 如 果 测 试 的 时 间 要 比 运行 最 终 代 码 的 时 间 多 ,编译 所 需 的 时 间 和 空 
间 就 变 得 很 重要 了 。 

对 运行 空间 ,我 们 无 法 明确 地 考量 ， 这 是 因为 如 下 两 个 因素 : 

e 指令 空间 和 静态 分 配 的 数据 空间 是 由 编译 器 在 编译 时 确定 的 ， 它 们 的 大 小 可 以 用 操作 

系统 指令 来 得 到 。 

e 递归 栈 空间 和 动态 分 配 的 变量 空间 可 以 用 前 面 的 分 析 方 法 明确 地 估算 。 

现在 要 确定 的 是 程序 的 运行 时 间 。 为 此 我 们 需要 一 个 定时 机 制 。 本 书 使 用 C++ 函数 
clock() 来 测量 时 间 ， 它 用 “滴答 ” 数 来 计时 。 在 头 文件 time.h 中 定义 了 常数 CLOCK _PER_ 
SEC, 它 记 录 每 秒 流逝 的 “滴答 ” 数 ， 并 转换 成 秒 。CLOCK _ PER _SEC=1000， 滴 答 一 次 等 于 
一 训 秒 。 虽 然 还 有 更 精确 的 时 间 函 数 ， 例 如 QueryPerformanceCounter， 但 是 C++ 的 clock() 
函数 已 经 足够 用 了 。 

假定 要 测量 程序 2-15 的 函数 insertionSort 在 最 坏 情 况 下 的 运行 时 间 。 首 先 需 要 做 的 是 : 

1 ) 确定 实例 特征 的 一 组 值 以 及 对 应 的 运行 时 间 。 
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2 ) 对 实例 特征 n 的 每 一 个 值 ， 设 计 最 坏 情况 下 的 测试 数据 。 


4.2 选择 实例 的 大 小 


确定 实例 特征 n 的 值 需要 以 下 两 个 因素 : 程序 执行 的 时 间 及 执行 的 次 数 。 假 定 要 预测 在 
最 坏 情 况 下 对 n 个 元 素 的 数组 进行 插入 排序 所 需要 的 时 间 。 例 3-25 的 insertionSort 函数 在 最 
坏 情况 下 的 复杂 度 为 9(m*)， 即 n 的 平方 函数 。 在 理论 上 ， 如 果 知 道 的 任意 3 个 值 所 对 应 的 
运行 时 间 ， 就 可 以 确定 这 个 平方 函数 。 利 用 这 个 平方 函数 ， 可 以 得 到 的 任何 一 个 值 所 对 应 
的 运行 时 间 。 在 实践 过 程 中 ， 通 常 需要 n 的 3 个 以 上 的 值 ， 其 原因 如 下 : 

1 ) 渐 近 分 析 仅 对 足够 大 的 n 给 出 了 程序 的 复杂 度 。 当 1 比较 小 时 ,程序 的 运行 时 间 可 能 
并 不 满足 渐 近 曲线 。 为 了 确定 渐 近 曲线 以 外 的 点 ， 我 们 需要 检查 若干 个 产值 所 对 应 的 运行 时 间 。 

2 ) 即使 在 渐 近 曲线 的 区 间 内 ， 程 序 实际 运行 时 间 也 可 能 不 满足 预定 的 渐 近 曲线 ， 原 因 
是 渐 近 分 析 忽 略 了 许多 低 次 项 的 时 间 需 求 。 例 如 ， 一 个 程序 的 渐 近 复杂 度 为 9(w*)， 而 它 的 实 
际 复 杂 度 可 以 是 cin*+cznlogntcan+cs， 或 其 他 任何 最 高 次 项 为 cr 的 函数 ， 其 中 ci 为 常量 且 
CI>0。 

我 们 认为 ,程序 2-15 的 时 间 复 杂 度 ， 对 一 些小 于 100 的 n 值 ， 就 开始 满足 渐 近 曲线 了 。 
因此 ， 可 能 只 需要 很 少量 的 大 于 100 的 n 值 来 测量 时 间 。 一 个 合理 的 选择 是 n=200，300， 
400，…，1000， 这 个 选择 并 没有 任何 奥妙 。 也 可 以 选择 n=500，1000，1500,，…，10 000 或 
n=512，1024，2048，…，2”。 后 者 将 耗费 更 多 的 机 时 ， 而 且 很 可 能 得 不 到 更 好 的 测量 结果 。 

而 对 [0,100] 范围 内 的 n 值 ， 可 以 进行 更 精细 的 测量 ， 因 为 我 们 并 不 是 很 清楚 渐 近 复杂 度 
从 何 处 开始 有 效 。 当 然 ， 如 果 测 量 结果 表明 ， 平 方 函 数 复杂 度 并 不 是 从 这 个 范围 开始 有 效 的 ， 
那么 可 对 [100,200] 范围 进行 更 细致 的 测量 ， 如 此 进行 下 去 ， 直 至 找到 起 始点 。 测 量 [0,100] 
范围 内 的 运行 时 间 可 以 从 n=0 开始 , 每 次 增加 10。 


4.3 设计 测试 数据 


为 了 使 很 多 程序 能 够 产生 最 好 和 最 坏 复杂 度 ， 我 们 可 以 徒手 设计 或 借助 计算 机 设计 相 
应 的 测试 数据 。 可 是 通常 很 难 设 计 可 以 产生 平均 复杂 度 的 测试 数据 。 以 n 元 素 的 插入 排序 
insertionSort 为 例 ， 能 产生 最 坏 复杂 度 的 测试 数据 应 是 一 个 递减 的 序列 ， 如 n,n-1, n-2,…, 1 ; 
能 产生 最 好 复杂 度 的 测试 数据 应 是 一 个 递增 的 序列 ， 如 0,1,2,…, n-1; 但 是 ,我 们 很 难 设计 一 
组 能 够 产生 平均 复杂 度 的 测试 数据 。 

如 果 不 能 为 预期 的 复杂 度 设计 一 组 测试 数据 , 那 就 从 随机 生成 的 数据 中 选择 用 时 最 少 
(最 多 , 平均 ) 的 数据 作为 测试 数据 ， 以 得 到 最 好 (最 坏 ,平均 ) 复杂 度 的 估算 值 。 


4.4 实验 设计 
在 选择 了 实例 的 大 小 并 设计 了 测试 数据 之 后 , 就 可 以 编写 程序 来 测量 所 期 望 的 运行 时 间 
了 。 对 于 插入 排序 , 程序 4-1 给 出 了 测试 的 过 程 。 相 应 的 测试 数据 见 图 4-1。 
程序 4-1 导致 插入 排序 出 现 最 坏 复 杂 度 的 程序 


int main() 


{ 
int a[1000], step = 10; 
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double clocksPerMillis = double(CLOCKS PER SEC) / 1000; 
1/ 每 毫秒 滴答 一 次 


cout << "The worst-case time, in milliseconds, are" << endl; 
cout << "n Nt Time" << endl; 


WA 次 数 二 = 0，10; 20; “5 100; 200; 300; “, 1000 
for (int n = 0; n <= 1000; n += step) 
{ 
1/ 用 最 坏 测试 数据 初始 化 
for ‘(dnt 1 OF 1 < ny Li+) 
a[li)】 = = 1; 


clock 七 startTime = Clock( ); 
insertionSort (a, n); 
double elapsedMillis = (clock( ) - startTime) / clocksPerMillis; 


Cout << n << '\t’' << elapsedMillis << endl; 


if (n == 100) step = 100; 
} 
return 0; 


} 


我 们 来 看 图 4-1 给 出 的 测试 结果 。 当 元 素 个 数 n 不 等 于 800 时 ， 排 序 时 间 为 0。 排序 800 
个 元 素 最 多 用 时 15 毫秒 ， 而 排序 1000 个 元 素 却 用 时 为 0， 这 个 结果 显然 不 对 。 出 现 这 个 问题 
的 原因 是 ， 在 最 坏 情 况 下 的 排序 时 间 太 少 ， 计 
时 函数 clock0 测量 不 出 来 。C++ 语言 没有 说 明 
计时 函数 的 精确 度 ， 我 们 假设 精确 度 在 100 个 
时 钟 单位 之 内 ， 在 我 们 选用 的 系统 中 等 于 100 
毫秒 。 如 果 时 钟 函数 返回 值 是 +， 那么 实际 时 间 
应 在 max{0,1-100} 和 100 之 间 。 在 图 4-1 中 ， 
对 n=1000 的 测量 时 间 是 0。 因 此 ， 实 际 时 间 可 
能 在 0 和 100 毫秒 之 间 。 如 果 我 们 希望 测量 结 
果 的 精确 度 在 10% 以 内 ， 那么 clockO-startTime 
的 值 至 少 应 该 是 1000 个 时 钟 单 位 ， 即 1 秒 。 
图 4-1 显示 的 时 间 没 有 达到 这 个 标准 。 

为 了 提高 测量 的 精确 度 ， 需 要 对 实例 特征 
n 的 每 个 值 重 复 排序 若干 次 。 因 为 每 次 排序 都 使 数组 有 序 ， 所 以 再 次 排序 之 前 ， 要 重新 对 数 
组 初始 化 。 程 序 4-2 是 新 的 时 间 测 试 程序 。 现 在 所 测量 的 时 间 ， 不 仅 包 括 排序 所 需 的 时 间 ， 
还 包括 数组 a 的 初始 化 和 while 循环 所 需要 的 时 间 。 图 4-2 是 相应 的 测量 结果 。 图 4-3 是 相应 
的 曲线 图 。 
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时 间 单 位 毫秒 
图 4-1 程序 4-1 的 测试 结果 


程序 4-2 误差 在 10% 以 内 的 测量 程序 
int main'() 
{ 
int a[1000], step = 10; 
double clocksPerMillis = double(CLOCKS PER SEC) / 1000; 
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淄 一 部 分 斋 备 知 区 





/每 毫秒 滴答 一 次 


cout << "The worst-case time, in milliseconds, 
cout << "n \tRepetitions \t Total Ticks \tTime 


淡妆 n= ,10.20 om LO00 200, 300; ws 1000 
for (int n= 0; n <= 1000; n += step) 
{ 
1/ 为 实例 特征 n 测量 运行 时 间 
long numberOfRepetitions = 0; 
clock 七 startTime = clock( ); 
do 
{ 
numberOfRepetitions+t+; 
// 用 最 坏 测试 数据 初始 化 
for (int 主 = 0F tl < ny i++) 
a[lt] = n= i 
insertionSort(a, n); 
} while (clock( ) - startTime < 1000); 
1/ 重复 运行 ， 只 到 有 足够 的 时 间 流 逝 
double elapsedMillis = (clock( ) - startTime) 


are" << endl; 
Per Sort™" << endl; 


/ clocksPerMillis; 
<< elapsedMillis 


cout << n << '\t' << numberOfRepetitions << '\t' 
<< '\t' << elapsedMillis / numberOfRepetitions 
<< endl; 

if (n == 100) step = 100; 


】 


return 0; 





6 605 842 


0 00 
37 | oo 
00216 | oo 
一 sse oo 


n 

| 10 | 80252 
700 
800 





时 间 单 位 毫秒 
图 4-2 程序 4-2 的 测试 结果 
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为 了 确定 while 循环 和 数组 初始 化 所 需要 的 额外 时 间 ， 我 们 运行 程序 4-2， 但 是 要 去 除 其 
中 的 语句 : 

insertionSort (a,n); 

图 4-4 是 相应 的 运行 结果 。 从 图 4-2 的 每 次 排序 时 间 中 减 去 每 次 排序 的 额外 时 间 ， 便 是 
最 坏 情 况 下 的 插入 排序 时 间 。 注 意 ， 在 图 4-2 中 ， 当 n 较 大 时 ，n 每 次 增 到 两 倍 ， 相 应 的 时 间 
都 增 到 4 倍 。 这 是 我 们 期 望 的 结果 ， 因 为 程序 最 坏 的 复杂 度 是 @(n”)。 
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图 4-3 在 最 坏 情况 下 的 插入 排序 时 间 曲 线 图 图 4-4 对 图 4-2 的 额外 时 间 测 量 
练习 


1. 为 什么 程序 4-3 的 误差 范围 不 在 10% 以 内 ? 
程序 4-3 测量 时 间 的 不 正确 方法 


int main() 
{ 
long numberOfRepetitions=0; 
clock t elapsedTime=0; 
do 
{ 
numberOfRepetitions++; 
clock t startTime=clock(); 


QoSomething()， 


elapsedTime+=clock()-startTime; 
}while(elapsedTime<1000); 
1/ 重复 直至 有 足够 的 时 间 流 逝 


cout<<"Time is (in ticks)" 
<<((double)elapsedTime) /numberOfRepetitions 
<<endl; 

return(0); 
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利用 程序 4-2， 对 程序 2-14 和 程序 2-15 的 两 个 播 入 排序 版 本 ， 测 量 在 最 坏 情 况 下 的 运行 时 
间 。 使 用 程序 4-2 的 n 值 。 试 比较 两 种 插入 排序 方法 的 优点 。 


.利用 程序 4-2， 对 程序 2-9 和 程序 2-13 的 两 种 冒 泡 排 序 ， 测 量 在 最 坏 情况 下 的 运行 时 间 。 


使 用 程序 4-2 的 n 值 。 不 过 你 要 证 实 ， 程序 4-2 在 最 坏 情况 下 的 测试 数据 实际 上 也 是 这 两 种 
冒 泡 排序 函数 在 最 坏 情况 下 的 测试 数据 。 使 用 三 列 的 表格 显示 结果 。 三 列 分 别 是 : n、 程 序 
2-9、 程 序 2-13。 指 出 这 两 种 冒 泡 排序 函数 在 最 坏 情况 下 的 性 能 。 


. 1 ) 为 程序 2-7 和 程序 2-12 的 两 个 选择 排序 函数 ， 设 计 最 坏 复杂 度 的 测试 数据 。 


2 ) 适当 修改 程序 4-2， 用 以 测量 这 两 种 选择 排序 函数 在 最 坏 情 况 下 的 运行 时 间 。 使 用 程序 
4-2 的 n 值 。 

3 ) 使 用 三 列 的 表格 显示 结果 。 三 列 分 别 是 : n、 程 序 2-7、 程 序 2-12。 

4 ) 比较 这 两 种 选择 排序 函数 在 最 坏 情况 下 的 性 能 。 


. 比较 程序 2-15 的 插入 排序 、 程 序 2-12 的 及 时 终止 选择 排序 和 程序 2-13 的 冒 泡 排序 在 最 坏 


情况 下 的 运行 时 间 。 为 了 形式 一 致 ， 把 程序 2-13 重 写 为 一 个 函数 。 

1 ) 设计 测试 数据 ， 以 使 每 种 函数 产生 最 坏 复 杂 度 。 

2 ) 使 用 1) 中 的 测试 数据 和 程序 4-2 的 测试 程序 ， 获 取 最 坏 运 行 时 间 。 

3 ) 采用 两 种 形式 来 显示 最 坏 运行 时 间 。 一 种 形式 为 表格 。 表 格 有 四 列 : n、 选 择 排序 、 冒 
泡 排 序 、 插 入 排序 。 另 一 种 形式 为 曲线 图 ， 其 中 有 三 条 曲线 ， 每 条 曲线 对 应 一 种 排序 方 
法 。 图 的 x 轴 表示 na，?7 轴 表示 时 间 。 

4 ) 比较 这 三 种 排序 函数 在 最 坏 情况 下 的 性 能 。 

5 ) 对 于 每 个 n， 测 量 额 外 时 间 ， 并 用 图 4-4 的 表格 形式 给 出 测试 结果 。 从 2 ) 所 得 到 的 时 
间 中 减 去 额外 时 间 ， 然 后 给 出 一 个 新 的 时 间 表 和 新 的 曲线 图 。 

6 ) 在 减 去 额外 时 间 后 ， 在 4 ) 中 所 得 到 的 结论 是 否 发 生 了 变化 ? 

7 ) 利用 已 得 到 的 数据 ， 佑 算 每 种 排序 函数 对 2000、4000 和 10 000 个 元 素 进行 排序 时 的 最 
坏 运行 时 间 。 


. 修改 程序 4-2， 用 以 估算 insertionSort 函数 ( 见 程序 2-15) 的 平均 运行 时 间 。 要 求 如 下 : 


1 ) 在 每 一 次 while 循环 中 ， 对 0，1，…，n-l 的 随机 排列 进行 排序 。 这 种 随机 排列 是 由 一 
个 随机 排列 产生 器 生成 的 。 如 果 找 不 到 这 样 的 函数 ， 可 以 用 随机 数 生 成 器 来 编写 ， 或 简 
单 地 产生 一 个 na 个 数 的 随机 序列 。 

2 ) 设置 while 循环 ， 使 得 在 一 次 循环 中 至 少 有 20 个 随机 排列 被 排序 ， 并 且 至 少 需要 耗费 
10 个 时 钟 单 位 。 

3 ) 用 耗费 的 时 间 除 以 随机 排列 数目 ， 得 到 平均 排序 时 间 。 

用 表格 的 形式 显示 平均 运行 时 间 。 


. 利用 练习 6 的 策略 ， 对 程序 2-9 和 程序 2-13 的 冒 泡 排序 函数 估算 平均 运行 时 间 。 使 用 程序 


4-2 的 n 值 。 分 别 用 表格 和 曲线 图 显示 估算 结果 。 

利用 练习 6 的 策略 ， 对 程序 2-7 和 程序 2-12 的 选择 排序 函数 估算 平均 运行 时 间 。 使 用 程序 
4-2 的 n 值 。 分 别 用 表格 和 曲线 图 显示 结果 。 

利用 练习 6 的 策略 ， 对 程序 2-12、 程 序 2-13 和 程序 2-15 的 排序 函数 估算 和 比较 平均 运行 
时 间 。 使 用 程序 4-2 的 n 值 。 分 别 用 表格 和 曲线 图 显示 结果 。 


10. 编写 测试 程序 ， 用 以 确定 顺序 查找 ( 见 程序 2-1) 和 折 半 查找 ( 见 程序 3-1) 在 查找 成 功 时 的 


平均 时 间 。 假 定数 组 的 每 个 元 素 被 查找 的 概率 相同 。 分 别 用 表格 和 曲线 图 显示 估算 结果 。 
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11. 编写 测试 程序 ， 用 以 确定 顺序 查找 ( 见 程序 2-1) 和 折 半 查找 ( 见 程序 3-1) 在 查找 成 功 时 的 
最 坏 运 行 时 间 。 分 别 用 表格 和 曲线 图 显示 结 

12. 对 于 rows=10, 20, 30, …, 100， 确 定 函 数 matrixAdd( 见 程序 2-21) 的 运行 时 间 。 分 别 用 表 
格 和 曲线 图 显示 结果 。 

13. C++ 有 一 个 排序 函数 sort(begin'end)， 可 以 用 来 对 数组 a[0:n-l] 排 序 ， 调 用 语句 
sort(a,a+n)。 这 个 排序 函数 在 头 文件 algorithm 中 ， 综 合 了 插 和 排序、 快速 排序 ( 见 18.2.3 
节 ) 和 推 排序 ( 见 12.6.1 节 )。 时 间 复 杂 度 是 O(nlogn)。 对 最 好 和 最 坏 的 测试 数据 ， 测 量 
这 种 排序 方法 的 运行 时 间 。 并 与 程序 2-15 的 运行 时 间 比 较 。 

14. 对 于 rows=10, 20, 30, …, 100， 确 定 函 数 transpose( 见 程序 2-19) 的 运行 时 间 。 分 别 用 表格 
和 曲线 图 显示 结果 。 

15. 对 于 rows=10, 20, 30, …, 100， 确 定 函 数 squareMatrixMultiply( 见 程序 2-22) 的 运行 时 间 。 
分 别 用 表格 和 曲线 图 显示 结果 。 


4.5 ”高 速 缓存 
4.5.1 简单 计算 机 模型 


我 们 来 看 一 个 简单 的 计算 机 模型 ， 它 的 存储 由 一 个 一 级 缓存 LI1 (1level 1 )、 一 个 二 级 缓存 
L2 和 主 存 构成 。 算 术 和 侵 辑 操作 由 算术 和 逻辑 单元 ( ALU ) 对 存储 在 寄存 器 (R ) 中 的 数据 
进行 处 理 来 完成 。 图 4-5 是 这 个 计算 机 模型 的 一 部 分 。 

通常 ， 主 存 的 大 小 是 几 十 或 几 百 
MB ; 二 级 缓存 的 大 小 不 足 1MB ; 一 级 
缓存 的 大 小 是 几 十 KB ; 寄存 器 的 数量 在 
8 和 32 之 间 。 程 序 开始 运行 时 ， 所 有 数 
据 都 在 主 存 。 

要 执行 一 个 算术 运算 ,例如 加 法 ， 首 先 把 相 加 的 数据 从 主 存 移 到 寄存 器 ， 然 后 把 寄存 器 
的 数据 相 加 ， 最 后 把 结果 写 人 主 存 。 

我 们 把 寄存 器 的 数据 相 加 所 需要 的 时 间作 为 一 个 周期 。 把 一 级 缓存 的 数据 送 到 一 个 寄存 
器 所 需要 的 时 间 是 两 个 周期 。 如 果 需 要 的 数据 设 有 在 一 级 缓存 ， 而 是 在 二 级 缓存 ， 即 一 级 组 
存 未 命中 ,那么 把 需要 的 数据 从 二 级 缓存 送 到 一 级 缓存 和 寄存 器 需要 10 个 周期 。 当 需要 的 数 
据 没有 在 二 级 缓存 ， 即 二 级 缓存 未 命中 时 ， 把 需要 的 数据 从 主 存 复制 到 二 级 缓存 、 一 级 缓存 
和 寄存 器 需要 100 个 周期 。 我 们 把 写 操作 ， 甚 至 向 主 存 的 写 操作 ， 算 作 一 个 周期 ， 因 为 不 需 
要 等 到 写 操作 完成 之 后 再 进行 下 一 个 操作 。 


4.5.2 ”缓存 未 命中 对 运行 时 间 的 影响 
在 我 们 的 简化 计算 机 模型 中 ， 语 句 a=b+c 编译 后 的 机 器 指令 是 


load a;load b;add; store Cr 


其 中 ，load 操作 把 数据 送 到 寄存 器 ，store 操作 把 相 加 后 的 结果 送 到 主 存 。add 和 store 操作 共 
需要 两 个 周期 。 两 个 load 操作 可 能 需要 4 个 周期 至 200 个 周期 不 等 ， 这 取决 于 数据 是 否 在 组 
存 中 ， 即 缓存 是 否 命中 。 因 此 ， 语句 a=b+tce 所 需要 的 总 时 间 从 6 个 周期 到 202 个 周期 不 等 。 





ALU 


图 4-5 简单 计算 机 模型 


88 党 一 记 分 ” 预 冀 和 大 


在 实际 操作 中 ， 时 间 差 别 没有 这 么 极端 ， 因 为 可 以 把 连续 的 缓存 未 命中 所 花费 的 时 间 交 叉 
处 理 。 

假定 有 两 个 类 型 相同 的 算术 运算 。 第 一 个 算术 运算 是 2000 次 加 法 ， 它 需要 4000 次 load 
操作 、2000 次 add 操作 和 2000 次 store 操作 。 第 二 个 算术 运算 是 1000 次 加 法 。 第 一 个 算术 运 
算 的 数据 访问 有 25% 的 load 操作 出 现 一 级 缓存 未 命中 ， 另 有 25% 的 load 操作 出 现 二 级 缓存 
未 命中 。 在 我 们 这 个 简化 的 计算 机 模型 中 ， 第 一 个 算术 运算 所 需要 的 时 间 是 2000*2 (有 50% 
的 load 操作 是 缓存 命中 ) +1000*10 ( 有 25% 的 load 操作 出 现 一 级 缓存 未 命中 ) +1000*100 
(有 25% 的 10ad 操 作出 现 二 级 缓存 未 命中 ) +2000*1 ( 用 于 adds ) +2000*1 ( 用 于 stores) 
=118 000 个 周期 。 如 果 第 二 个 算术 运算 有 100% 的 二 级 缓存 未 命中 ， 它 的 用 时 =2000*100 (有 
100% 的 二 级 缓存 未 命中 ) +1000*1 (adds ) +1000*1 ( stores ) =202 000 个 周期 。 第 二 个 运算 
的 量 是 第 一 个 的 一 半 ， 但 实际 用 时 却 比 第 一 个 多 76%。 

为 了 减少 缓存 未 命中 的 数量 ， 从 而 减少 程序 的 运行 时 间 ， 计算 机 采用 了 一 些 策略 ， 比 如 ， 
把 最 近 需 要 处 理 的 数据 预 载 到 缓存 中 ， 当 出 现 一 个 缓存 未 命中 时 ， 把 需要 的 数据 和 相 邻 字 节 
中 的 数据 装 人 缓存 中 。 当 连续 的 计算 机 操作 使 用 的 是 相 邻 字 节 的 数据 时 ， 这 个 策略 很 有 效 。 

虽然 我 们 的 讨论 集中 在 如 何 用 缓存 来 减少 访问 数据 的 时 间 问 题 上 ， 但 是 我 们 也 用 缓存 来 
减少 访问 指令 的 时 间 。 


4.5.3 ”矩阵 乘法 


也 许 有 人 不 相信 ， 在 一 台 商 用 计算 机 上 ， 一 个 操作 多 的 程序 可 能 比 一 个 操作 少 的 程序 实 
际 用 时 要 少 。 本 节 就 是 要 让 这 些 人 相信 ， 确 有 此 事 。 

我 们 从 一 个 实际 的 程序 2-22 人 手 。 它 是 把 两 个 用 二 维 数组 描述 的 方 阵 相 乘 。 计 算 如 下 
所 示 : 


c[i][j]= Zalillx]*blk][jJli<ign,1l<jgn (4-1) 


k=1 


( 你 不 理解 矩阵 乘法 没关系 ， 这 不 影响 你 对 我 们 要 说 明 的 问题 的 理解 。 和 矩阵 乘法 将 在 
7.2.1 节 中 讨论 。) 程序 2-22 是 一 段 标准 代码 ， 你 在 很 多 教科 书 上 都 可 以 找到 。 程 序 4-4 是 另 
一 段 代码 ， 它 和 程序 2-22 一 样 ， 产 生 一 个 二 维 数组 c。 我 们 来 观察 程序 4-4。 它 有 两 层 髓 套 的 
for 循 环 ， 这 是 程序 2-22 所 没有 的 ， 这 使 它 对 数组 e 的 索引 处 理 得 更 多 一 些 。 其 余 的 操作 都 
一 样 。 


程序 4-4 ” 比 程序 2-22 效率 低 的 方 阵 乘 法 
void fastSquareMatrixMulItiply(int ** a, int ** D int ** CA int n) 


{ 


fOr (4 i 三 07 并 交通 六 工业 +) 


for (int 3 = 0F 3 < nr j++) 
c[li][j] = 0; 
for (int 1 = 0; i < my i++) 


for (int Jj = 07 3 < nr j++) 
for (int k = 0; k < n; k++) 
SULILI] += BLiTIR] * BkK] [jly 
) 


你 会 发 现 ， 把 程序 4-4 的 三 层 幅 套 for 循环 重新 排列 一 下 顺序 ， 结 果 是 不 变 的 。 我 们 把 程 








序 4-4 的 在 套 循 环 顺序 称 为 水 。 当 我 们 把 第 二 层 和 第 三 层 的 for 循环 交换 次 序 ， 我 们 得 到 的 
艇 套 循 环 顺序 是 ikj。 一 共有 3!=6 种 伦 套 循环 顺序 。 由 6 种 向 套 循环 顺序 分 别 生 成 的 函数 都 
以 同样 的 数量 执行 每 一 种 类 型 的 操作 。 因 此 你 也 许 认 为 这 些 函 数 所 需 的 运行 时 间 也 是 相同 的 。 
但 是 错 了 。 改 变 了 循环 的 次 序 ， 也 就 改变 了 数据 访问 模式 ， 进 而 改变 了 缓冲 未 命中 的 数量 ， 
最 终 影响 了 运行 时 间 。 

在 ijk 顺序 中 ， 数 组 a 和 e 的 元 素 是 按 行 访问 的 ， 数 组 b 的 元 素 是 按 列 访问 的 。 因 为 同行 
的 元 素 在 存储 中 是 相 邻 的 ， 而 同 列 的 元 素 在 存储 中 是 分 开 的 ， 所 以 当 数 组 很 大 ， 以 至 三 个 数 
组 不 能 同时 存储 在 二 级 缓存 L2 中 的 时 候 ， 访 问 数组 b 可 能 导致 很 多 二 级 缓存 未 命中 的 事件 。 
在 ikji 的 顺序 中 ， 数 组 a、b 和 e 的 元 素 是 按 行 访问 的 ， 因 此 二 级 缓存 未 命中 的 事件 就 比较 少 ， 
因此 所 需 时 间 也 比较 少 。 

图 4-6 给 出 了 程序 2-22 和 程序 4-4 分 别 使 用 ijk 
顺序 和 jj 顺序 时 的 运行 时 间 。 图 4-7 显示 的 是 标准 
运行 时 间 ， 即 一 个 函数 的 运行 时 间 除 以 在 jkj 顺序 下 
执行 的 时 间 。 

多 么 神奇 啊 !ikj 顺序 要 比 ijk 顺序 和 程序 2-22 
运行 快 。 实 际 上 ， 当 n=500 时 ，ikj 顺序 所 需要 的 时 
间 仅 是 ijk 顺序 的 1/3, 是 程序 2-22 的 1/2 ; 当 n=1000 时 ， 比 率 近 似 是 7116 和 1/4 ; 当 n=2000 
时 ， 比 率 近似 是 113 和 1/16。 记 住 ， 按 操作 步 数 计算 ，ikj 顺序 比 程 序 2-22 和 ijk 顺序 所 执行 
的 操作 要 多 。 只 有 闻 j 顺序 的 运行 时 间 是 按照 渐 近 分 析 的 比率 9(m) 增长 的 。ijk 顺序 和 程序 
2-22 的 运行 时 间 是 受 缓冲 未 命中 事件 所 
控制 的 ， 而 不 受 执行 步 数 所 控制 。 4 

存储 等 级 制 对 代码 性 能 的 影响 随 着 
程序 语言 、 编 译 器 、 编 译 器 选项 和 计算 5 加 
机 配置 的 变化 而 变化 。 例 如 ，2.4GHz 
Intel Pentium IV PC 的 二 级 缓存 比 1.7 
GHz PC 的 二 级 缓存 大 一 倍 , 图 4-6 和 2 
图 4-7 所 给 出 的 矩阵 乘法 的 时 间 是 用 后 tT 








图 4-6 矩阵 乘法 的 用 时 ( 以 秒 为 单位 ) 

















者 实验 得 来 的 ， 如 果 用 前 者 实验 ,那么 “0 一 上 06 人 

当 n=500 时 ， 比 率 大 约 是 9/116 和 2/5; mult ijk 

当 p= Y 琉 大 久 /3 ; RE 
5 本， 化 汪 25 约 是 四 潭 431 图 4-7 阵 乘法 的 标准 运行 时 间 


当 n=2000 时 ， 比 率 大 约 是 1/4 和 1/5。 
练习 


16. 对 程序 4-4 中 三 层 能 套 for 循环 的 所 有 6 个 顺序 ， 重复 图 4-6 的 实验 。 分 别 用 表格 和 条 形 
图 给 出 实验 结果 。 
17. 在 另 一 种 矩阵 相 乘 的 实现 中 ， 我 们 首先 计算 转 置 矩 阵 bt[][j=b[k][j]。 于 是 公式 (4-1) 
变 为 : 
oi]= Dai] bd)1 <i<m,1 <j<p (4-2) 


1 ) 编写 函数 计算 二 维 数组 c， 首 先 计 算 矩 阵 bt， 然 后 使 用 公式 ( 4-2 )。 你 应 该 编写 出 7 个 
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函数 : 对 三 层 峙 套 for 循环 的 6 个 排列 顺序 ， 每 一 个 对 应 一 个 函数 。 还 有 一 个 是 与 程 
序 2-22 对 应 的 函数 。 

2 ) 选择 n=500, 1000, 2000， 分别 测 量 这 7 个 函数 的 运行 时 间 。 

3 ) 用 表格 和 条 形 图 显示 测量 结果 。 把 这 些 结 果 与 练习 16 的 结果 进行 比较 。 

18. 编写 一 个 函数 ， 把 一 个 n xn 和 矩阵 分 块 转 置 。 也 就 是 说 ， 把 矩阵 分 割 为 一 组 kxk 的 子 和 矩阵 
(一 个 子 和 矩阵 算 一 块 )， 然 后 一 次 转 置 一 个 子 矩 了 泗 。 对 一 个 很 大 的 n， 测量 你 的 转 置 函数 的 
运行 时 间 ， 其 中 k=2,4,8,16,32 和 64, n 是 2 的 究 。 你 的 代码 性 能 和 程序 2-19 的 转 置 代 码 
性 能 如 何 比 较 。 你 能 解释 各 自 的 优 劣 吗 ? 


4.6 参考 及 推荐 读物 


要 更 多 地 了 解 关 于 缓存 的 知识 ， 请 参考 J. Hennessey, D. Patterson.Computer Organization 
and Design.2nd ed.Morgan Kaufmann Publishers, Inc., SanFrancisco，CA，1998, 第 7 章 。 
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概述 


我 们 从 本 章 开始 研究 数据 结构 ， 一 直到 第 16 章 为 止 。 第 5 章 和 第 6 章 集中 研究 线性 表 ， 
但 主要 是 介绍 数据 的 描述 方法 ， 即 数据 在 计算 机 内 存 和 磁盘 上 的 存储 方式 。 在 随后 的 章节 中 ， 
我 们 研究 其 他 常用 的 数据 结构 描述 方法 。 这 些 数据 结构 有 和 矩阵 、 栈 、 队 列 、 字 典 、 优 先 级 队 
列 、 竞 赛 树 、 搜 索 树 和 图 。 

C++ 程序 常用 的 数据 描述 方法 是 数组 描述 和 链 式 描述 。 线 性 表 可 以 用 来 说 明 这 两 种 方法 。 
本 章 研 究 数组 描述 的 线性 表 ， 下 一 章 研 究 链 式 描述 的 线性 表 。 

STL 容器 〈vector 和 list ) 大 致 相当 于 线性 表 的 数组 描述 方法 和 和 链 式 描述 方法 。STL 的 类 
还 有 很 多 其 他 的 方法 。 在 建立 线性 表 的 数组 描述 和 链 式 描 述 中 ， 我 们 使 用 的 函数 名 和 签名 与 
STL 代码 所 使 用 的 相同 。 这 使 读者 很 容易 转换 到 STL 代码 。 

数组 描述 方法 将 元 素 存 储 在 一 个 数组 中 ， 用 一 个 数学 公式 来 确定 每 个 元 素 存 储 的 位 置 ， 
即 在 数组 中 的 索引 。 这 是 最 简单 的 一 种 存储 方式 ， 所 有 元 素 依次 存储 在 一 片 连续 的 存储 空间 
中 ， 这 就 是 通常 所 说 的 顺序 表 。 

本 章 引 入 的 数据 结构 的 概念 如 下 : 

。 抽象 数据 类 型 和 相应 的 C++ 抽象 类 。 

e 线性 表 。 

e 变 长 数组 和 数组 容量 倍增 。 

e 数组 描述 。 

e 数据 结构 迭代 器 。 

本 章 新 增 的 C++ 概念 : 

e 抽象 类 。 

。 迭代 唤 。 

本 章 没 有 介绍 数组 的 应 用 实例 ， 因 为 第 1 ~ 3 章 已 经 介绍 了 许多 。 


数据 对 象 和 数据 结构 
数据 对 象 ( data object ) 是 一 组 实例 或 值 ， 例 如 : 


boolean= {false,true} 

digit={0, 1, 2, 3, 4, 5, 6, 7, 8, 9} 
lettet={A., B; Cs , Zs 对 
naturalNumber={0, 1, 2, ……} 
integer={0， 土 1， 十 2， 土 3，…} 


5. 


一 人 


string={a，b，'…，aa，ab，ac，…} 
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Boolean 、digit、letter、naturalNumber 、integer 和 string 都 是 数据 对 象 ，true 和 false 是 
boolean 的 实例 , 而 0，1，…，9 是 digit 的 实例 。 数 据 对 象 的 一 个 实例 ， 要 么 是 一 个 不 可 再 
分 的 “原子 "， 要 么 是 由 另 一 个 数据 对 象 的 实例 作为 成 员 复合 而 成 。 对 后 一 种 情形 ， 用 元 素 
(element ) 来 表示 这 些 成 员 。 

例如 ， 对 数据 对 象 naturalNumber 的 每 个 实例 ， 可 以 看 做 是 原子 ， 不 可 能 再 分 解 ; 也 可 以 
看 做 是 由 digit 数据 对 象 的 若干 实例 复合 而 成 的 。 按 照 这 种 观点 ，naturalNumber 的 实例 675 是 
由 digit 的 实例 6、7 和 5 顺序 组 成 的 。 

数据 对 象 string 是 由 所 有 可 能 的 串 实例 组 成 的 集合 。 每 个 实例 都 由 字符 组 成 。 例 如 ， 
good ,atrip to Hawaii ,going down hill 和 abcabcdabcde 都 是 串 实例 。 第 一 个 串 由 4 个 元 素 g、.o、 
o 和 d 顺序 组 成 ， 每 个 元 素 都 是 数据 对 象 letter 的 实例 。 

数据 对 象 的 实例 以 及 构成 实例 的 元 素 通 常 都 有 某 种 相关 性 。 例 如 ， 自 然 数 0 是 最 小 的 自 
然 数 ，1 是 仅 比 0 大 的 自然 数 ， 而 2 是 1 之 后 的 下 一 个 自然 数 。 在 自然 数 675 中 ，6 是 最 高 有 
效 位 ，7 在 其 次 ， 而 $ 是 最 低 有 效 位 。 在 串 good 中 ，g 是 第 一 字母 ，o 是 第 二 和 第 三 个 字母 ， 
而 d 是 最 后 一 个 字母 。 

除了 相关 性 以 外 ， 任 何 一 个 数据 对 象 通 常 都 有 一 组 相关 的 操作 或 函数 。 这 些 也 数 可 以 把 
对 象 的 某 个 实例 转化 成 该 对 象 的 另外 一 个 实例 ， 或 转化 成 另 一 个 数据 对 象 的 实例 ， 或 者 同时 
进行 上 述 两 种 转化 。 函 数 也 可 以 不 用 转化 而 创建 一 个 新 的 实例 。 例 如 ， 把 两 个 自然 数 相 加 的 
函数 创建 了 一 个 新 的 自然 数 ， 而 两 个 加 数 并 没有 发 生 转 化 。 

数据 结构 ( data structure ) 是 一 个 数据 对 象 ， 同 时 这 个 对 象 的 实例 以 及 构成 实例 的 元 素 都 
存在 着 联系 ， 而 且 这 些 联系 由 相关 的 函数 来 规定 。 

研究 数据 结构 ， 关 心 的 是 数据 对 象 ( 实际 上 是 实例 ) 的 描述 以 及 相关 函数 的 具体 实现 。 
数据 对 象 描述 得 好 ， 函 数 的 实现 就 会 高 效 。” 

最 常用 的 数据 对 象 以 及 操作 都 已 经 在 C++ 中 作为 基本 数据 类 型 而 实现 ， 如 整数 对 象 
(int)、 布 尔 对 象 (bool ) 等 。 其 他 数据 对 象 均 可 以 用 基本 数据 类 型 以 及 由 C++ 的 类 、 数 组 和 
指针 所 提供 的 组 合 功能 来 描述 。 本 书 研究 的 很 多 数据 对 象 〈 例 如 线性 表 、 栈 、 队 列 和 优先 级 
队列 ) 都 可 以 用 STL 的 类 来 实现 。 


5.2 线性 表 数 据 结构 


线性 表 (linear list ) 也 称 有 序 表 ( ordered list )， 它 的 每 一 个 实例 都 是 元 素 的 一 个 有 序 集 
合 -。 每 一 个 实例 的 形式 为 (eo,e1,…,es1)， 其 中 是 有 穷 自 然 数 ，e; 是 线性 表 的 元 素 ，i 是 元 素 
ei 的 索引 ，n 是 线性 表 的 长 度 或 大 小 。 元 素 可 以 被 看 做 原子 ， 它 们 本 身 的 结构 与 线性 表 的 结构 
无 关 。 当 n=0 时 ， 线 性 表 为 空 ; 当 n>0 时，eo 是 线性 表 的 第 0 个 元 素 或 首 元 素 ，e, 1 是 线性 
表 的 最 后 一 个 元 素 。 可 以 认为 eo 先 于 e!，el 先 于 e， 等 等 。 除 了 这 种 先后 关系 之 外 ， 线 性 表 
不 再 有 其 他 关系 。 

以 下 是 一 些 线性 表 的 例子 : 1 ) 一 个 班级 的 学 生 按 姓名 的 字母 顺序 排列 的 列表 ; 2 ) 按 非 
递减 次 序 排 列 的 考试 分 数 表 ; 3 ) 按 字母 顺序 排列 的 会 议 列表 ; 4 ) 奥林匹克 男子 篮球 比赛 的 
金牌 获得 者 按 年 代 次 序 排列 的 列表 。 根 据 这 些 例 子 可 以 理解 对 线性 表 应 该 实施 的 下 列 操作 : 

e 创建 一 个 线性 表 。 


日 ”这 里 的 效率 是 指 操作 执行 时 的 效率 和 软件 开发 和 维护 时 的 效率 。 
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。 撤销 一 个 线性 表 。 

e 确定 线性 表 是 否 为 空 。 

e 确定 线性 表 的 长 度 。 

。 按 一 个 给 定 的 索引 查找 一 个 元 素 。 
。 按 一 个 给 定 的 元 素 查找 其 索引 。 
e。 按 一 个 给 定 的 索引 删除 一 个 元 素 。 
e 按 一 个 给 定 的 索引 插入 一 个 元 素 。 
e 从 左 至 右 顺序 输出 线性 表 元 素 。 


5.2.1 抽象 数据 类 型 linearList 


一 个 线性 表 可 以 用 一 个 抽象 数据 类 型 ( abstract data type，ADT ) 来 说 明 ， 既 说 明 它 的 实 
例 ， 也 说 明 对 它 的 操作 ( 见 ADT 5-1 )。 抽 象 数据 类 型 的 说 明 独 立 于 任何 程序 语言 的 描述 。 所 
有 对 抽象 数据 类 型 的 语言 描述 必须 满足 抽象 数据 类 型 的 说 明 ， 抽 象 数 据 类 型 的 说 明 保证 了 程 
序 语言 描述 的 有 效 性 。 另 外 ， 所 有 满足 抽象 数据 类 型 说 明 的 语言 描述 ， 都 可 以 在 应 用 中 替换 
使 用 。 在 ADT 5-1 中 ， 我 们 省 略 了 对 创建 一 个 实例 和 撤销 一 个 实例 的 操作 说 明 ， 所 有 ADT 说 
明 都 隐 含 着 对 它们 的 说 明 。 


抽象 数据 类 型 linearList 
{ 
实例 
有 限 个 元 素 的 有 序 集合 
操作 
empty(): 若 表 空 ， 则 返回 true， 和 否则 返回 false 
size(): 返回 线性 表 的 大 小 ( 表 的 元 素 个 数 ) 


getlindex): 返回 线性 表 中 索引 为 index 的 元 素 
indexOf(x): 返回 线性 表 中 第 一 次 出 现 的 x 的 索引 。 若 x 不 存在 ， 则 返回 -1 
erase(index): 删除 索引 为 index 的 元 素 ， 索 引 大 于 index 的 元 素 其 索引 减 1 
insert(index, x): 把 x 插 人 线性 表 中 索引 为 index 的 位 置 上 ， 索 引 大 于 等 于 index 的 元 素 其 索引 加 1 
output(): 从 左 到 右 输出 表 元 素 





} 
ADT 5-1 线性 表 的 抽象 数据 类 型 说 明 


5.2.2 ”抽象 类 linearList 


C++ 支持 两 种 类 一 一 抽象 类 和 具体 类 。 一 个 抽象 类 包含 着 没有 实现 代码 的 成 员 函 数 。 这 
样 的 成 员 函 数 称 为 纯 虚 函数 (pure virtual function )。 纯 虚 函 数 用 数字 0 作为 初始 值 来 说 明 ， 
形式 如 下 : 


virtual int myPureVirtualFunction(int x)=0; 


具体 类 是 没有 纯 虚 函数 的 类 。 只 有 具体 类 才 可 以 实例 化 。 也 就 是 说 ， 我 们 只 能 对 具体 类 
建立 实例 或 对 象 。 不 过 ， 我 们 可 以 建立 抽象 类 的 对 象 指 针 。 

对 抽象 数据 类 型 ADT， 与 其 用 ADT 5-1 所 示 的 非 形式 语言 方法 来 描述 ， 不 如 用 抽象 类 来 
描述 ， 如 程序 5-1 所 示 。 
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程序 5-1 一 个 线性 表 的 抽象 类 


template<class T> 
class linearList 
{ 
publice:;: 
virtual ~linearList() {}; 
virtual pool empty() const = 0; 
1/1/ 返回 true， 当 上 且 仅 当 线性 表 为 空 
virtual int size() const = 0» 
1/ 返回 线性 表 的 元 素 个 数 
Virtual T& get (int theIndex) const = 0; 
/返回 索引 为 theIndex 的 元 素 
Virtual int indexOf (const T& theElement) const = 0; 
/返回 元 素 theElement 第 一 次 出 现时 的 索引 
Virtual void erase (int theIndex) = 0; 
// 删除 索引 为 theIndex 的 元 素 
virtual void insert (int theIndex, const T& theElement) = 0; 
/把 theElement 插入 线性 表 中 索引 为 theIndex 的 位 置 上 
virtual void output (ostream& out) const = 0; 


/把 线性 表 插 入 输出 流 out 








} 


显然 ,， ADT 5-1 的 抽象 数据 类 型 不 依赖 程序 语言 ， 而 程序 5-1 的 C++ 抽象 类 依赖 程序 语 
言 ， 其 中 有 很 多 关键 词 只 在 C++ 中 才 有 定义 。 但 是 它们 的 说 明 很 相似 ， 即 公有 函数 相同 ， 这 
使 得 从 C++ 抽象 类 派生 出 的 具体 类 也 与 抽象 数据 类 型 相似 。 不 过 ， 一 个 抽象 类 的 派生 类 ， 只 
有 实现 了 基 类 的 所 有 纯 虚 函数 才 是 具体 类 ， 否 则 依然 是 抽象 类 而 不 能 实例 化 。 

我 们 把 抽象 类 的 析 构 函数 定义 为 虚 函 数 ， 目 的 是 ， 当 一 个 线性 表 的 实例 离开 作用 域 时 ， 
需要 调用 的 缺 省 析 构 函数 是 引用 对 象 中 数据 类 型 的 析 构 函数 。 


练习 


1. 令 L= (a,b,c,d ) 是 一 个 线性 表 。 下 面 每 一 个 操作 的 结果 是 什么 ? 
1 ) emptyO 
2 ) size() 
3 ) get(0)，get(2)，get(6)，get(-3) 
4) indexOf(a), indexOf(c), indexOf(q) 
5 ) erase(0), erase(2), erase(3) 
6 ) insert(0,e), insert(2,f), insert(3,g), insert(4,h), insert(6,h), insert(-3,h) 


5.3 ”数组 描述 
5.3.1 描述 


在 数组 描述 ( array representation ) 中 ， 用 数组 来 存储 线性 表 的 元 素 。 虽 然 可 以 用 一 个 数 
组 存储 若干 个 线性 表 的 实例 ( 见 5.5 节 )， 但 是 用 不 同 数组 存储 每 个 实例 更 容易 一 些 。 我 们 可 
以 用 一 个 数学 公式 来 确定 一 个 线性 表 的 元 素 在 数组 中 的 位 置 。 

假定 使 用 一 个 一 维 数组 element 来 存储 线性 表 的 元 素 。 数 组 element 的 位 置 有 
clement[0]… element[arrayLength-1]， 其 中 arrayLength 是 数组 长 度 或 容量 。 数 组 的 每 一 个 位 
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置 都 可 以 存储 线性 表 的 一 个 元 素 。 我 们 需要 一 个 映射 ， 使 线性 表 的 一 个 元 素 对 应 数组 的 一 个 
位 置 。 线 性 表 的 第 0 个 元 素 在 数组 的 什么 位 置 ? 线性 表 的 最 后 一 个 元 素 在 数组 的 什么 位 置 ? 
这 种 映射 可 以 用 下 面 的 一 个 公式 来 表示 : 
location(i)=i (5-1) 
由 公式 (5-1 ) 可 知 ， 第 i 个 线性 表 元 素 ( 如果 存 在 的 话 ) 在 数组 中 的 存储 位 置 是 i。 
图 5-1a 应 用 公式 (5-1)， 在 长 度 为 10 的 数 


element [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] 


组 element 中， 存储 了 5 个 元 素 的 线性 表 | | | 
[5,2,4,8,1]。 


把 线性 表 元 素 映射 到 数组 中 去 ， 公 式 


(5-1 ) 是 一 种 自然 的 选择 。 但 是 也 可 以 选择 其 element [0] [1] [2] [3] [4] [SIg [7] [8] [9] 
他 的 公式 。 例 如 公式 LT [本 和 


a) location (i)=i 


b) location (7?) =9-i 











location(i) = arrayLength-—i-—! (5-2) 
从 数组 右 端 开始 存储 线性 表 元 素 。 公 式 element [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] 
location(i) = (location(0)+i)%arrayLength ( 5-3 ) | | 8 a 
从 数组 的 某 一 个 位 置 开始 ， 环绕 到 数组 c) location (i)=(i+7) %10 
头 来 存储 线性 表 元 素 。 图 5-lb 显示 了 应 用 公 a 
式 (5-2 ) 时 ,线性 表 [5, 2, 4, 8, 1 ] 是 如 何 存 映射 到 一 个 一 维 数组 


储 的 。 图 5-1c 显示 了 应 用 公式 ( 5-3 ) 时 ， 该 列表 是 如 何 存储 的 ， 其 中 location(0)=7。 公 式 
(5-3 ) 在 第 9 章 用 于 将 一 个 队列 映射 到 一 个 一 维 数组 。 
在 线性 表 的 数组 描述 中 ,我们 用 一 维 数组 element， 通 过 公式 ( 5-1 ) 来 存储 表 元 素 ， 用 
变量 listSize 记录 当前 存储 的 线性 表 元 素 个 数 ， 用 变量 arrayLength 表示 数组 长 度 。 
要 删除 线性 表 元 素 e;, 方法 是 把 它 右边 
本 element [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] 
的 元 素 都 向 左 移动 一 个 位 置 。 例 如 ， 要 删除 








el=2， 必 须 把 ei 右边 的 元 素 ez=4、e3=8 和 es=1 a) 从 element [1] 处 删除 2.listSize = 4 
| 数组 位 
下 到 放电 位 置 1、 2 和 3,， 国 394 大 时 际 所 的 aaa 网 而 轴 轴 语 可 而 疝 夯 疯 
结果 ， 阴 影 部 分 是 移动 的 元 素 。 151417 区 We | | | | | 
为 了 插入 一 个 元 素 ， 使 其 成 为 线性 表 的 b) 在 element [2] 处 插入 7,listSize = 5 
第 i 个 元 素 ， 必 须 首 先 把 当前 元 素 e; 和 它 右边 图 5-2 ”删除 和 插入 一 个 元 素 


的 元 素 都 向 右 移 动 一 个 位 置 ， 然 后 把 新 元 素 存 
储 到 数组 第 i 个 位 置 。 例 如 ， 要 插入 7， 使 其 成 为 图 5-2a 的 第 2 个 元 素 ， 首先 把 元 素 e=8 和 
e@3=1 向 右 移动 一 个 位 置 ， 然 后 把 7 搬 到 数组 的 第 2 个 位 置 。 图 5-2b 是 插入 后 的 结果 ， 阴 影 部 
分 是 移动 的 元 素 。 

要 创建 一 个 数组 类 ， 以 实现 抽象 数据 类 型 linearList， 必 须 首 先 选择 数组 element 的 类 型 
和 数组 长 度 。 使 用 模板 类 可 以 很 好 地 解决 第 一 个 问题 。 使 用 动态 数组 可 以 很 好 地 解决 第 二 个 
问题 ， 首 先 按照 用 户 估计 的 长 度 创 建 数组 ， 然 后 在 数组 空间 不 足 的 情况 下 ， 动 态 地 增加 数组 
长 度 。 


5.3.2” 变 长 一 维 数组 
一 维 数组 a， 线 性 表 元 素 存储 在 a[0:n-1] 中 。 要 增加 或 减少 这 个 数组 的 长 度 ， 首 先 要 建 
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立 一 个 具有 新 长 度 的 数组 ， 然 后 把 数组 a 的 元 素 复 制 到 这 个 新 数组 ， 最 后 改变 数组 a 的 值 ， 
使 它 能 够 引用 新 数组 。 程 序 5-2 的 函数 changeLength1D 所 实现 的 便 是 这 个 算法 。 

创建 一 个 长 度 为 m 的 数组 所 需 时 间 为 9(1)。 注 意 ， 调 用 操作 符 new 可 能 会 抛 出 类 型 为 
bad alloc 的 异常 。 如 果 操 作 符 new 实施 成 功 ， 那 么 将 源 数组 复制 到 目标 数组 的 时 间 复 杂 度 是 
O(n)。 因 此 ， 程 序 5-2 的 时 间 复 杂 度 是 O(n)。 

当 数 组 满 而 需要 加 大 数组 长 度 时 ， 数 组 长 度 常常 是 要 加 倍 的 。 这 个 过 程 称 为 数组 倍增 
(array doubling )。 数 组 倍增 的 时 间 ， 从 渐 近 意义 上 考量 ， 不 会 大 于 元 素 插入 的 总 时 间 ( 见 定 
理 3-1 


程序 5-2 ”改变 一 个 一 维 数组 长 度 


template<class T> 
void changeLengthlD(T*& ar int oldLength, int newLength) 
{ 
if (newLength < 0) 
throw illegalParameterValue ("new length must be >= 0"); 


T* temp = new T[newLength]; 1/ 新 数组 

int number = min(oldLength, newLength); /1/ 需要 复制 的 元 素 个 数 
copyl(la, a + number,;, temp); 

delete [] a; 1/ 释放 老 数 组 的 内 存 空间 
a = temp; 


5.3.3 类 arrayList 


1. arrayList 的 类 定义 

我 们 定义 一 个 C++ 抽象 类 linearList 的 派生 类 arrayList， 它 利用 公式 (5-1 ) 实现 抽象 数 
据 类 型 linearList。 程 序 5-3 是 类 头 、 数 据 成 员 和 方法 / 函数 原型 。 因 为 arrayList 是 一 个 具体 
类 ， 所 以 它 必须 实现 抽象 类 linearList 的 所 有 方法 。 不 仅 如 此 ， 它 还 包含 基 类 linearList 没有 
声明 的 方法 ， 例 如 ，capacity 和 checkIndex。 方 法 capacity 给 出 的 是 数组 element 当前 的 长 度 ， 
而 方法 checkIndex 要 确定 一 个 元 素 在 范围 0 ~ listSize-1 内 的 索引 。 


程序 5-3 ”类 arrayList 的 定义 


template<class T> 
class arrayList ; public linearList<T> 
{ 
BPubLlie 
1/ 构造 函数 ， 复制 构造 函数 和 析 构 函数 
arrayList(int initialCapacity = 10); 
arrayList (const arrayList<T>&); 


~arrayList() {delete [] element;} 

/1 ADT 方法 

bool empty() const {return listSize == 0;} 
int size() const {return listSize;} 


T& get (int theIndex) const; 

int indexOf (const T& theElement) const; 

void erase (int theIndex); 

void insert (int theIndex, const T& theElement); 
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void output (ostream& out) const; 


1/ 其 他 方法 


int capacity() const {return arrayLength;} 


protected: 
void checkIindex (int theIndex) const; 


1// 若 索引 theIndex 无 效 ， 则 抛 出 异常 


T* element; /1/ 存储 线性 表 元 素 的 一 维 数 组 
int arrayLength; 1/ 一 维 数组 的 容量 
int listSize; // 线性 表 的 元 素 个 数 


}; 


2. arrayList 的 构造 函数 和 复制 构造 函数 

程序 5-4 给 出 了 类 的 构造 函数 和 复制 构造 函数 。 构 造 函 数 创建 了 一 个 长 度 为 
initialCapacity 的 数组 ，initialCapacity 的 缺 省 值 是 10。 构 造 函 数 令 数据 成 员 arrayLength 的 值 
等 于 initialCapacity，listSize 等 于 0。 复 制 构 造 函 数 是 复制 一 个 对 象 。 当 一 个 对 象 传 值 给 一 个 
函数 ， 或 者 一 个 也 数 返回 一 个 对 象 时 ， 都 需要 调用 复制 构造 函数 。 它 的 代码 利用 了 STL 的 算 
法 copy( 见 1.8 节 )。 


程序 5-4 ”类 arrayList 的 构造 函数 


template<class T> 
arrayList<T>::arrayList (int initialCapacity) 
{/ 构造 函数 

if (initialCapacity < 1) 

{ostringstream s; 

s << "Initial capacity = " << initialCapacity << " Must be > 0"; 

throw illegalParameterValue(s.str()); 

} 

arrayLength = initialCapacity; 

element = new T[arrayLength]; 

listSize = 0; 
} 


template<class T> 
arrayList<T>: :arrayList (const arrayList<T>& theList) 
{1/ 复制 构造 函数 
arrayLength = theList.arrayLength; 
listSize = theList.listSsize; 
element = new Tl[larrayLength]; 
copy (theList.element, theList.element + listSize, element); 


} 


程序 5-4 也 给 出 了 函数 empty、size 和 capacity 的 代码 。 如 果 操 作 符 new 的 时 间 复 杂 度 是 


O(I)、 那 么 当 工 是 基本 类 型 时 ， 构 造 函 数 的 时 间 复 杂 度 是 0(1)。 当 了 是 用 户 自 定义 类 型 时 ， 
构造 函数 的 时 间 复 杂 度 是 O(initialCapacity)， 因 为 在 创建 数组 时 ， 数 组 每 一 个 位 置 上 的 用 户 自 
定义 类 型 TT 都 需要 调用 构造 函数 。 方 法 empty、size 和 capacity 的 时 间 复 杂 度 都 是 0(1)， 复 制 
构造 函数 的 时 间 复 杂 度 是 O(n)， 其 中 是 要 复制 的 线性 表 的 大 小 。 


3. arrayList 实例 化 
用 数组 描述 的 线性 表 需 要 使 用 下 面 的 语句 来 创建 / 实例 化 。 
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/ 创建 两 个 容量 为 100 的 线性 表 
linearList *Xx=(1inearList)new arrayList<int>(100) 7 
arrayList<double> Y(100) 


/利用 容量 的 缺 省 值 创建 一 个 线性 表 


arrayList<char> Zz7 


11 用 线性 表 y 复制 创建 一 个 线性 表 

arrayList<double> wl(y); 

4. arrayList 的 基本 方法 

程序 5-5 是 方法 checkIndex、get 和 indexOf 的 实现 。 方 法 indexOf 的 代码 使 用 了 STL 的 
函数 fnd 以 查找 匹配 元 素 第 一 次 出 现 的 位 置 。 


程序 5-5 checkiIndex、get 和 indexOf 


template<class T> 
void arrayList<T>::checkIndex (int theIndex) const 
{1/ 确定 索引 theIndex 在 0 和 1istSize - 1 之 间 


if (theIndex < 0 || theIndex >= listSize) 
{ostringstream s; 
Ss << "index = " << theIndex << " size = " << listSize; 


throw illegallindex(s.str()); 
} 


template<class T> 
T& arrayList<T>::get (int theIindex) const 
{/ 返回 索引 为 theIndex 的 元 素 
/ 若 此 元 素 不 存在 ， 则 抛 出 异常 
checkindex (theIndexX) : 
return element [theIndex]; 
. 


template<class T> 

int arrayList<T>::indexOf (const T& theElement) const 
{// 返回 元 素 theElement 第 一 次 出 现时 的 索引 

1/ 车 该 元 素 不 存在 ， 则 返回 -1 


// 查找 元 素 theElement 
int theIndex = (int) (find(element, element + listSize, theElement)- element); 


// 确定 元 素 theElement 是 否 找 到 
IE (theindex == listSize) 
/没有 找到 
FetuEn -1 
else return theIndex; 


方法 checkIndex 和 get 的 时 间 复 杂 度 是 @(1), indexOf 的 时 间 复 杂 度 是 O(max {listSize,1})。 
为 简单 起 见 ， 我 们 以 后 常 把 O(max {listSize,1}) 写成 O(listSize)。 

5. 删除 一 个 元 素 

为 了 从 线性 表 中 删除 索引 为 theIndex 的 元 素 ， 首 先 要 确定 线性 表 包 含 这 个 元 素 ， 然 后 删 
除 这 个 元 素 。 若 没有 这 个 元 素 ， 则 抛 出 类 型 为 illegallIndex 的 异常 。 








当 要 删除 索引 为 theIndex 的 元 素 时 ， 利 用 copy 算法 把 索引 从 theIndex+1, theIndex+2,…， 
listSize-1 的 元 素 向 左 移动 一 个 位 置 ， 然 后 把 变量 listSize 的 值 减 1。 程 序 5-6 的 erase 实现 了 这 
个 算法 。 


程序 5-6 ”删除 索引 为 thelndex 的 元 素 


template<class T> 

void arrayList<T>::erase (int theIndex) 

{/ 删除 其 索引 为 theIndex 的 元 素 

1/ 如 果 该 元 素 不 存在 ， 则 抛 出 异常 illegalIndex 
checkIndex (theIndex); 





// 有效 索引 ， 移 动 其 索引 大 于 theIndex 的 元 素 


copy (element + theInaex + 1, element + listSize, element + theIndex); 


element[--listSize] .~T(); /调用 析 构 函数 
} 





如 果 没 有 索引 theIndex 的 元 素 ， 就 抛 出 异常 ,erase 时 间 复 杂 度 是 8(1)。 如 果 有 这 个 元 素 ， 
那么 要 移动 的 元 素 个 数 是 listSize-theIndex， 时 间 复 杂 度 是 @(listSize-theIndex) ( 假设 每 一 个 
元 素 的 移动 需要 0(1) 时 间 )。 因 此 全 部 时 间 复 杂 度 是 OUlistSize-theIndex)。 

6. 插入 一 个 元 素 

要 在 线性 表 中 索引 为 theIndex 的 位 置 上 插入 一 个 新 元 素 ， 首 先 把 索引 从 theIndex 到 
listSize-1 的 元 素 向 右 移动 一 个 位 置 ， 然 后 将 新 元 素 插 人 索引 为 theIndex 的 位 置 ， 最 后 将 变量 
listSize 的 值 增 1。 向 右 移动 元 素 的 操作 是 利用 STL 函数 copy _ backward 来 完成 的 ， 而 没有 利 
用 copy 函数 。 该 函数 是 从 最 右 端的 元 素 开 始 移动 。 程 序 5-7 是 完成 插入 操作 的 C++ 代码 。 如 
果 在 插入 前 ， 数 组 空间 已 满 ， 那 么 将 数组 长 度 加 售 。 


程序 5-7 ”在 索引 thelndex 的 位 置 上 插入 一 个 元 素 


template<class T> 
void arrayList<T>::insert (int theIndex, const T& theElement) 
{// 在 索引 theIndex 处 插入 元 素 theElement 


if (theInaex < 0 || thelindex > listSize) 
{VW 无 效 索引 
ostringstream S7 
S << "index = " << thelIndex << " size = " << listSize; 


throw illegalIindex(s.str()); 
} 


1/ 有 效 索 引 ， 确 定数 组 是 否 已 满 
if (listSize == arrayLength) 
{/ 数组 空间 已 满 ， 数 组 长 度 倍增 
changeLengthlD(element， arrayLength, 2 * arrayLength); 
arrayLength *= 2; 
} 


// 把 元 素 向 右 移动 一 个 位 置 
Copy_backward (element + thelIndex, element + listSize, 
element + listSize + 1): 





element [theIndex] = theElement; 


觉 和 但 线性 天 一 一 数 绍 梢 过 101 





listSizet+? 
} 


确定 是 否 抛 出 异常 ， 时 间 复 杂 度 是 @(1)。 数 组 长 度 加 倍 ， 时 间 复 杂 度 是 @(arrayLength)= 
OldlistSize)。 移 动 数 组 元 素 ， 时 间 复 杂 度 是 B@(listSize-theIndex)。 因 此 ， 总 的 时 间 复 杂 度 是 
OUlistSize)。 

为 什么 数组 长 度 不 是 增加 1 或 2， 而 是 要 加 倍 呢 ? 数组 长 度 每 次 增加 1 或 2， 虽然 不 影响 
插 人 操作 的 最 坏 时 间 复 杂 度 ( 即 BdistSize) )， 但 是 影响 连续 插 和 人 时 的 渐 近 时 间 复 杂 度 。 假 设 
从 一 个 长 度 为 1 的 空 表 开 始 ， 执 行 n=2 和 +1 次 插入 。 假 设 插入 的 位 置 都 是 表 尾 。 于 是 ， 插 入 不 
需要 移动 已 经 存在 的 元 素 , 7 次 插入 的 时 间 是 6(n) 加 上 增加 数组 长 度 的 时 间 。 如 果 数 组 长 度 


1 一 1 


每 次 增加 1， 那么 增加 数组 长 度 的 时 间 是 el 2 = @(n)。 于 是 ，n 次 插入 的 总 时 间 是 Goz)。 


i= 


如 果 数组 长 度 增 倍 ， 那 么 改变 数组 长 度 的 时 间 是 6{ 立 2j=6@(C2%-D) = @(m)。 于 是 ,次 


插入 的 总 时 间 是 9(n)。 事 实 上 ， 对 这 种 分 析 进 行 简单 归纳 后 得 出 ， 如 果 数 组 长 度 总 是 按 一 个 
乘法 因子 来 增加 (从 arrayLength 到 c*arrayLength， 其 中 c>1 是 一 个 常数 )， 那 么 增加 数组 长 
度 的 总 时 间 是 Omumber of inserts)， 即 使 删除 和 其 他 操作 挫 杂 其 间 。 通 过 这 种 分 析 ， 我 们 得 到 
了 定理 5-1。 

定理 5-1 如 果 我 们 总 是 按 一 个 乘法 因子 来 增加 数组 长 度 (程序 5-7 的 常数 因子 是 2 )， 
那么 实施 一 系列 线性 表 的 操作 所 需要 的 时 间 与 不 用 改变 数组 长 度 时 相 比 ， 至 多 增加 一 个 常数 
因子 。 

7. 输出 函数 output 和 重 载 << 

程序 5-8 是 输出 函数 output 的 代码 。 假 设 插入 一 个 元 素 的 时 间 是 0(1)， 那 么 这 个 代码 的 
时 间 是 O(listSize)。 程 序 5-8 还 重 载 了 流 插 人 符 (insertion operator ) <<。 


程序 5-8 ”把 一 个 线性 表 插 入 输出 流 


template<class T> 
void arrayList<T>: :output (cout 一 out) const 
{W/ 把 线性 表 插入 输出 流 
copy (element, element + listSize, ostream iterator<T>(cout, "™ ")); 
} 
// 重 载 << 
template <class T> 
ostream& operator<<(ostreamé& out, const arrayList<T>g& x) 
{x.output (out); return out;]} 


8. 减少 数组 长 度 

虽然 用 数组 实现 的 线性 表 在 需要 的 时 候 要 增加 数组 长 度 ， 但 是 从 来 不 减少 数组 长 度 。 比 
如 说 ， 一 个 数组 的 长 度 增加 到 1 000 000 之 后 , 将 一 直 保 持 这 个 长 度 ， 直 到 数组 空间 被 撤销 ， 
哪怕 数组 只 有 不 到 10 个 元 素 。 

为 了 能 够 在 数组 元 素 减 少时 释放 一 些 数组 空间 ， 我 们 可 以 修改 erase 方 法 ， 当 
listSize<arrayLength/4 时 数组 长 度 减 到 max {initialCapaciy，arrayLength/2}。 这 个 改动 留 作 练 
习 20- 








9. 使 用 类 arrayList 
作为 使 用 arrayList 的 实例 ， 主 函数 和 生成 的 output 函数 可 以 在 本 书 网 站 上 找到 。 


5.3.4 C++ 迭代 器 


一 个 迭代 器 ( iterator ) 是 一 个 指针 ， 指 向 对 象 的 一 个 元 素 ( 例如 ， 一 个 指向 数组 元 素 的 
指针 )。 顾 名 思 义 ,一 个 迭代 器 可 以 用 来 逐个 访问 对 象 的 所 有 元 素 。 程 序 5-9 是 用 一 个 指向 数 
组 元 素 的 指针 y 访问 数组 的 所 有 元 素 。 指 针 y 的 类 型 是 int*， 表 明 它 是 指向 整 型 元 素 的 指针 。 
在 for 循环 中 ，y 经 初始 化 指向 数组 x[] 的 首 元 素 (x 实际 上 就 是 指向 数组 首 元 素 的 指针 )。 表 
达 式 y+ 使 y 指 向 数组 的 下 一 个 元 素 。 类 似 的 ，x+3 是 一 个 指针 ， 指 向 从 x 开始 的 第 3 个 位 
置 ， 即 指向 数组 最 后 一 个 元 素 x[2] 的 下 一 个 位 置 。 因 此 ， 在 程序 5-9 的 for 循环 语句 中 ， 指 针 
y 访问 了 范围 [x,x+3) 内 的 所 有 元 素 。 表 达 式 *y 是 指针 y 的 解 引用 ， 以 此 取得 y 指向 的 元 素 。 
程序 5-9 输出 x[0:2]。 


程序 5-9 ”使 用 数组 迭代 器 

int main() 
{ 

nt [3Tstd, Ly Zi 

1/ 用 指针 yy 遍历 数组 x 

for(int* y=x;y!=x+3;y++) 

Cout<<*y<<" 
cout<<endl; 
return 0; 


} 


下 面 的 代码 与 程序 5-9 的 循环 语句 等 价 。 
foxr (int i=0;E1=3yiT$) 
cut<<x[il<< 让 
你 可 能 认为 这 个 代码 比 程序 5-9 更 容易 理解 ， 但 是 程序 5-9 容易 推广 ， 以 至 可 以 输出 任何 具有 
迭代 器 的 对 象 的 元 素 。 代 码 
for(iterator i=start;i!=end;i++) 
Dos 2 
输出 在 范围 [start, end) 之 内 的 所 有 元 素 。 其 中 , iterator 是 迭代 器 类 型 , start 是 迭代 器 的 一 个 值 ， 
指向 范围 内 的 首 元 素 ，end 是 迭代 器 的 另 一 个 值 ， 指 向 要 输出 的 最 后 一 个 元 素 的 下 一 个 位 置 。 
迭代 器 是 编写 C++ 通用 算法 的 基础 概念 。STL 的 copy 函数 便 是 用 来 复制 任何 具有 迭代 
器 的 对 象 的 元 素 。 作 为 示例 ， 程 序 5-10 给 出 了 这 个 函数 的 一 种 可 行 的 代码 。 任 何 一 个 具有 迭 
代 器 的 对 象 都 定义 了 操作 符 !=、*、++ (后 ++) 以 及 解 引 用 赋值 操作 ( *to = )。 通 用 算法 不 同 ， 
对 迭代 器 的 性 能 要 求 也 不 同 。 例 如 ， 算 法 copy_backward 要 求 对 迭代 器 的 值 可 以 进行 减法 。 


程序 5-10 对 STL 的 copy 函数 的 一 种 可 行 的 代码 
template<class iterator> 
void copy (iterator start, iterator end, iterator to) 
{1/ 从 [start,end) 复制 到 [to,totend-start) 
while (start!=end) 
{*to=*start;start++;to++} 
} 
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为 了 简化 迭代 器 的 开发 和 基于 和 迭代 器 的 通用 算法 的 分 类 , C++ 的 STL 定义 了 5 种 迭代 器 : 
输入 、 输 出 、 向 前 、 双 向 和 随机 访问 。 所 有 和 迭代 器 都 具备 操作 符 ==、!= 和 解 引用 操作 符 *。 
另外 ， 输 入 迭代 器 还 提供 了 对 其 指向 元 素 的 只 读 操作 以 及 前 + 和 后 ++ 操作 符 。 输 出 迁 代 器 
提供 了 对 其 指向 元 素 的 写 操作 和 ++ 操作 符 。 向 前 迭代 器 具有 ++ 操作 符 ， 而 双向 迭代 器 既 具 
有 ++ 操作 符 也 具有 -- 操作 符 。 随 机 访问 迭代 器 是 最 一 般 的 迭代 器 ， 它 既 可 以 随意 地 实现 跳 
跃 移动 ， 也 可 以 通过 指针 算术 运算 来 实现 跳跃 移动 。 程 序 5-9 的 数组 迭代 器 y 便 是 随机 访问 
和 迭代 器 - 


5.3.5 ”arrayList 的 一 个 迭代 器 


我 们 定义 一 个 C++ 类 iterator， 它 是 类 arrayList 的 双向 迭代 器 。 这 个 迭代 器 是 类 arrayList 
的 公有 成 员 。 此 外 ， 我 们 还 为 类 arrayList 增加 两 个 公有 的 方法 begin() 和 end()。 它 们 的 返回 
值 分 别 是 指向 线性 表 首 元 素 element[0] 的 指针 和 尾 元 素 的 下 一 个 位 置 element[listSize] 的 指 
针 。 这 两 个 方法 的 代码 是 : 

class iterator; 


iterator begin() {return iterator (element),;} 
iterator end() {return iterator (element+listSize);} 


程序 5-11 是 类 iterator 的 代码 。5 个 typedef 语句 使 它 成 为 双向 迭代 器 ， 而 且 适 用 于 STL 
的 基于 双向 迭代 器 的 算法 。 每 一 个 方法 的 时 间 复 杂 度 是 8@(1)。 
下 面 的 语句 创建 了 一 个 迭代 融 实 例 并 初始 化 : 


arrayList<int>:;.iterator x=y.begin(); 


其 中 y 是 arrayList 类 型 的 对 象 。 有 了 和 迭代 器 ， 我 们 可 以 利用 STL 的 算法 去 实现 那些 仅 需要 双 
向 迭代 器 的 计算 。 例 如 ， 利 用 STL 的 算法 reverse， 将 线性 表 y 的 元 素 逆 置 。 利 用 STL 的 算 
法 accumulate， 对 线性 表 y 的 元 素 求 和 。 下 面 是 实现 这 两 个 算法 的 代码 : 


reversely.begin(),y.end()); 
int sum=accumulate(y.begin(), y.end(),0); 


然而 ,我 们 不 能 使 用 STL 的 算法 sort 去 实现 基于 随机 访问 迭代 器 的 算法 。 
程序 5-11 类 arrayList 的 一 个 迭代 器 


class iterator 
{ 
PUubLlic: 

/用 C++ 的 typedefE 语 名 实现 双向 迭代 器 
typedef bidirectional iterator tag iterator category; 
typedef T value type; 
typedef ptrdiff t difference type; 
typedef T* pointer; 
typedef T& reference; 


/构造 函数 


iterator (T* thePosition = 0) {position = thePosition;]} 


1/ 解 引用 操作 符 
T& operator*() const {return *position;} 
T* operator->() const {return &*position;} 
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// 迭代 器 的 值 增加 
iteratorg& operatort++() /前 加 
{++position; return *this;} 
iterator operator++ (int) // 后 加 
{iterator old = *this; 
++position; 


return old; 


} 


/和 迭代 器 的 值 减少 
iteratorg operator-——() 1/ 前 加 
{==position; return *this;} 
iterator operator-- (int) // 后 加 
{iterator old = *this; 
-=pOSsitlony 


return old; 


} 


1/ 测试 是 否 相 等 


bool operator!=(const iterator right) const 


{return position != right.position;} 
bool operator== (const iterator right) const 
{return position == right.position;} 
protected: 
T* position; 1/ 指向 表 元素 的 指针 


练习 


2. 令 L=(a,b,c,d,e) 是 一 个 线性 表 ， 且 基于 公式 (5-1 )， 用 数组 element 描述 。 假 设 arrayLength=10。 
模仿 图 5-2 做 图 ， 在 下 面 的 每 一 个 操作 之 后 显示 数组 的 内 容 和 1listSize 的 值 : 初始 状态 ， 
insert(0,f), insert(3,g), insert(7,h), erase(0), erase(4)。 

编写 一 个 函数 changeLength2D， 用 以 改变 一 个 二 维 数组 的 长 度 。 二 维 数组 的 每 一 维 的 长 度 

都 是 可 以 变化 的 。 测 试 你 的 代码 。 

4. 在 类 arrayList 中 增加 一 个 构造 是 数 ， 它 允许 你 指定 一 个 值 ， 在 数组 空间 满 时 ， 用 以 改变 数 

组 长 度 。 如 果 没 有 指定 这 个 值 ， 在 数组 空间 满 时 ， 将 数组 长 度 加 倍 。 按 同样 的 方法 修改 函 

数 insert。 测 试 你 的 代码 。 

. 编写 一 个 方法 arrayList<T>::trimToSize， 它 使 数组 的 长 度 等 于 max {listSize,1}。 这 个 方法 的 

复杂 度 是 多 少 ? 测试 你 的 代码 。 

6. 编写 方法 arrayList<T>::setSize， 它 使 线性 表 的 大 小 等 于 指定 的 大 小 。 若 线性 表 开 始 的 大 小 
小 于 指定 的 大 小 ， 则 不 增加 元 素 。 若 线性 表 开 始 的 大 小 大 于 指定 的 大 小 ， 则 删除 多 余 的 元 
素 。 这 个 方法 的 复杂 度 是 多 少 ? 测试 你 的 代码 。 

7. 重 载 操作 符 []， 使 得 表达 式 x 目 返回 对 线性 表 第 i 个 元 素 的 引用 。 若 线性 表 没 有 第 i 个 元 
素 ， 则 抛 出 异常 ilegalIndex。 语 句 x[i]=y 和 y= x[i] 按 以 往 预 期 的 方式 执行 。 测 试 你 的 代码 。 

8. 重 载 操作 符 ==， 使 得 表达 式 x==y 返回 true， 当 且 仅 当 两 个 用 数组 描述 的 线性 表 x 和 y 相 
等 ( 即 对 所 有 的 i， 两 个 线性 表 的 第 i 个 元 素 相 等 )。 测 试 你 的 代码 。 
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9. 重 载 操作 符 !=， 使 得 表达 式 x!=y 返回 true， 当 且 仅 当 两 个 用 数组 描述 的 线性 表 x 和 y 不 等 

( 见 练习 8 )。 测 试 你 的 代码 。 

10. 重 载 操 作 符 <， 使 得 表达 式 x<y 返回 true， 当 且 仅 当 用 数组 描述 的 线性 表 x 按 字典 顺序 小 

于 用 数组 描述 的 线性 表 y ( 见 练习 8 )。 测 试 你 的 代码 。 

. 编写 方法 arrayList<T>::push_back， 它 把 元 素 theElement 捅 到 线性 表 的 右 端 。 不 要 利用 

insert 方法 。 方 法 的 时 间 复 杂 度 是 多 少 ? 测试 你 的 代码 。 

12. 编写 方法 arrayList<T>::pop_back， 它 把 线性 表 右 端的 元 素 删除 。 不 要 利用 erase 方法 。 方 

法 的 时 间 复 杂 度 是 多 少 ? 测试 你 的 代码 。 

13. 编写 方法 arrayList<T>::swap(theList)， 它 交换 线性 表 的 元 素 *this 和 theList。 方 法 的 时 间 

复杂 度 是 多 少 ” 测试 你 的 代码 。 

14. 编写 方法 arrayList<T>::reserve(theCapacity)， 它 把 数组 的 容量 改变 为 当前 容量 和 theCapacity 

的 较 大 者 。 测试 你 的 代码 。 

15. 编写 方法 arrayList<T>::set(theIndex,theElement)， 它 用 元 素 theElement 替换 索引 为 theIndex 

的 元 素 。 若 案 引 theIndex 超出 范围 ， 则 抛 出 异常 。 返 回 原来 索引 为 theIndex 的 元 素 。 测 试 

你 的 代码 。 

16. 编写 方法 arrayList<T>::clear， 它 使 线性 表 为 空 。 方 法 的 复杂 度 是 多 少 ? 测试 你 的 代码 。 

17. 编写 方法 arrayList<T>::TremoveRange， 它 删除 指定 索引 范围 内 的 所 有 元 素 。 方 法 的 复杂 度 

是 多 少 ? 测试 你 的 代码 。 

18. 编写 方法 arrayList<T>::lastInexOf， 它 的 返回 值 是 指定 元 素 最 后 出 现时 的 索引 。 如 果 这 样 
的 元 素 不 存在 ， 则 返回 -1。 方 法 的 复杂 度 是 多 少 ? 测试 你 的 代码 。 

9. 证 明定 理 5-1。 

类 arrayList ( 程序 5-1 ) 的 缺点 是 ， 它 不 减少 数组 element 的 长 度 。 

1 ) 编写 类 arrayList 的 一 个 新 版 本 。 如 果 在 删除 之 后 ， 线 性 表 的 大 小 降 至 arrayLength/4 以 
下 ， 就 创建 一 个 新 的 数组 ， 长 度 为 max{arrayLength/2，initialCapacity}。 然 后 将 老 表 
中 的 元 素 复 制 到 新 表 。 

2 ) (选择 性 练习 ) 从 空 表 开 始 ， 考 察 大 小 为 n 的 线性 表 的 操作 序列 。 假 设 当 初始 容量 等 于 
或 超过 线性 表 大 小 的 最 大 值 时 ， 总 的 执行 步 数 是 f(n)。 证 明 ， 如 果 起 始 容 量 为 1， 而 且 
在 插入 和 删除 操作 中 ， 可 以 按照 上 面 和 5.3 节 所 述 的 方式 改变 数组 长 度 ， 那 么 执行 步 
数 最 多 为 cf(n)， 其 中 c 是 某 个 常数 。 

. 证 明 一 个 与 定理 5-1 类 似 的 定理 。 当 数组 满 时 ， 数 组 长 度 增加 一 个 常数 因子 c>1。 当 数组 

长 度 少 于 1/(2c) 时 ， 数 组 长 度 减少 一 个 常数 因子 ( 当然 ， 约 定数 组 长 度 永远 不 能 低 于 初始 

长 度 )。 

22. 1 ) 编写 方法 arrayList<T>::reverse， 它 原 地 颠倒 线性 表 元 素 的 顺序 ( 即 在 数组 element 中 
完成 操作 ， 不 创建 新 的 数组 )。 凑 倒 顺序 之 前 ， 线 性 表 的 第 k 个 元 素 是 element[k] ， 凑 
倒 之 后 ， 线 性 表 的 第 k 个 元 素 是 element[listSize-k-1]。 不 要 利用 STL 函数 reverse。 

2 ) 方法 应 具有 listSize 的 线性 复杂 度 。 证 明 这 个 性 能 。 

3 ) 设计 测试 数据 ， 测 试 方法 的 正确 性 。 

4) 编写 另 一 个 原 地 颠倒 arrayList 对 象 的 方法 。 它 不 是 arrayList 的 成 员 函 数 ， 不 能 访问 
arrayList 的 数据 成 员 。 不 过 ， 这 个 方法 可 以 调用 arrayList 的 成 员 函 数 。 

5 ) 计算 方法 的 复杂 度 。 
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6 ) 使 用 大 小 分 别 为 1000、5000 和 10 000 的 线性 表 ， 比 较 两 个 颠倒 顺序 算法 的 运行 时 间 
23.1) 编写 方法 arrayList<T>::leftShift(i)， 它 将 线性 表 的 元 素 向 左 移动 i 个 位 置 。 如 果 

x=[0,1,2,3,4]， 那 么 x.leftShift(2) 的 结果 是 x=[2,3,4]。 

2 ) 计算 方法 的 复杂 度 。 

3 ) 测试 你 的 代码 。 


24. 在 一 个 循环 移动 的 操作 中 ,， 线 性 表 的 元 素 根据 给 定 的 值 ， 按 顺 时 针 方向 移动 。 例 如 ， 
x=[0,1,2,3,4]， 循 环 移动 2 的 结果 是 x=[2,3,4,0,1]。 

1 ) 描述 一 下 如 何 利用 3 次 逆转 操作 完成 循环 移动 。 每 一 次 逆转 操作 都 可 以 将 线性 表 的 一 
部 分 或 全 部 道 转 。 

2 ) 编写 方法 arrayList<T>::cireularShift(i)， 它 将 线性 表 的 元 素 循环 移动 i 个 位 置 。 方 法 应 
具有 线性 表 长 度 的 线性 复杂 度 。 

3 ) 测试 你 的 代码 。 

25. 调用 语句 xhalf0， 可 以 将 x 的 元 素 隔 一 个 删除 一 个 。 如 果 xsize0 是 7,x.element[]=[2,13,4,5,17,8,29]， 
那么 xhalf 的 结果 是 xsize0 是 4,x.element 站 =[2,4,17,29]。 如 果 x.size0) 是 4,x.element[]=[2,13,4,5]， 
那么 x.half0 的 结果 是 x.size(0) 是 2，x.element[]=[2,4]。 如 果 x 为 空 ， 那 么 x.half0 的 结果 也 是 
x 为 空 。 

1 ) 编写 方法 arrayList<T>::halfD)。 不 能 利用 类 arrayList 的 其 他 方法 。 复 杂 度 应 该 为 
OflistSlize)。 

2 ) 证 明 方法 的 复杂 度 为 O(listSize)。 

3 ) 测试 你 的 代码 。 

26. 编写 一 个 函数 ， 它 与 练习 25 的 方法 half 等 价 。 这 个 函数 不 是 类 arrayList 的 成 员 ， 不 能 访 
问 类 的 任何 数据 成 员 。 但 是 它 利用 类 arrayList 的 公共 方法 可 以 完成 算法 。 计 算 方法 的 复杂 
度 。 测 试 你 的 代码 。 

27. 扩展 迭代 器 类 arrayList::iterator ( 程序 5-11 )， 使 得 它 成 为 随机 访问 迭代 器 。 利 用 STL 的 
排序 函数 对 一 个 线性 表 排 序 ， 以 测试 这 个 迭代 器 类 。 

28. 令 a 和 b 是 类 arrayList 的 两 个 对 象 。 

1 ) 编写 方法 arrayList<T>::meld(a,b)， 它 生成 一 个 新 的 线性 表 ， 从 a 的 第 0 个 元 素 开 始 ， 
交替 地 包含 a 和 的 元 素 。 如 果 一 个 表 的 元 素 取 完 了 ， 就 把 另 一 个 表 的 剩余 元 素 附 加 
到 新 表 中 。 调 用 语句 c.meld(a,b) 使 成 为 合并 后 的 表 。 方 法 应 具有 两 个 输入 线性 表 大 
小 的 线性 复杂 度 。 
2 ) 证 明 方法 具有 a 和 b 大 小 之 和 的 线性 复杂 度 。 
3 ) 测试 你 的 代码 。 
29. 令 a 和 b 是 类 arrayList 的 两 个 对 象 。 假 设 它们 的 元 素 从 左 到 右 非 递减 有 序 。 


1 ) 编写 方法 arrayList<T>::merge(a,b)， 它 生成 一 个 新 的 有 序 线性 表 ， 包含 a 和 的 所 有 元 
素 。 归 并 后 的 线性 表 是 调用 对 象 *this。 不 要 利用 STL 函数 merge。 
2 ) 计算 方法 的 复杂 度 。 
3 ) 测试 你 的 代码 。 
30. 1 ) 编写 方法 arrayList<T>::split(a,b)， 它 生成 两 个 线性 表 a 和 b。a 包含 *this 中 索引 为 偶 
数 的 元 素 , b 包含 其 余 的 元 素 。 
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2 ) 计算 方法 的 复杂 度 。 
3 ) 测试 你 的 代码 。 
31. 假设 用 公式 (5-3 ) 来 表示 线性 表 。 分 别 用 变量 first 和 last 表示 线性 表 首 元 素 和 尾 元 素 的 
位 置 。 
1 ) 开发 一 个 类 circularArrayList， 它 与 arrayList 类 似 。 实 现 所 有 的 方法 。 在 删除 和 捅 人 方 
法 中 ， 对 位 于 删除 或 插入 元 素 的 左面 或 右面 的 元 素 ， 有 选择 地 决定 向 左 移动 或 向 右 移 
动 ， 以 此 提高 方法 的 性 能 。 
2 ) 计算 每 一 个 方法 的 复杂 度 。 
3 ) 测试 你 的 代码 。 
32. 为 练习 31 的 类 circularArrayList 编写 双 回 迭代 器 。 
33. 使 用 公式 (5-3 ) 完成 练习 22。 
34. 使 用 公式 ( 5-3 ) 完成 练习 28。 
35. 使 用 公式 (5-3 ) 完成 练习 29。 
36. 使 用 公式 ( 5-3 ) 完成 练习 30。 


5.4 ”vector 的 描述 


STL 提供 了 一 个 基于 数组 的 类 vector。 这 个 类 不 仅 具 有 类 arrayList 的 所 有 功能 ， 而 且 还 
增加 了 很 多 方法 。 数 组 的 长 度 是 按 需 要 动态 增加 的 。 如 果实 施 插 入 操作 时 vector 已 满 ， 那 么 
vector 的 容量 将 按 原 容量 的 50% ~ 100% 来 增加 。 类 vector 没有 一 个 构造 函数 与 arrayList 的 
构造 函数 等 价 ， 也 没有 名 为 get、indexOf 和 output 的 方法 。 但 是 vector 和 arrayList 都 有 方法 
empty 和 size， 而 且 等 价 。 虽 然 vector 具有 方法 erase 和 insert, 分 别 表示 删除 和 插入 ,但 它 
们 需要 内 存 地 址 ， 而 不 是 索引 。vector 和 arrayList 还 有 一 点 不 同 ， 它 们 抛 出 的 异常 是 不 同 的 
类 型 。 为 了 说 明 这 些 不 同 点 ， 我 们 定义 了 一 个 类 vectorList， 它 利用 vector 描述 线性 表 ， 其 方 
法 的 签名 和 操作 与 linearList 方法 的 签名 和 操作 相同 。 因 此 ，arrayList 和 vectorList 可 以 交替 
使 用 。 

程序 5-12 ~ 程序 5-14 实现 了 一 部 分 vectorList 的 方法 。 


程序 5-12 ”利用 vector 实现 的 基于 数组 的 线性 表 


template<class T> 

class vectorList : public linearList<T> 

{ 

publie: 

// 构造 函数 ， 复 制 构造 函数 和 析 构 函数 
VectorList(int initialCapacity = 10) 7 
VectorList(const VectorList<T>&) 
~vectorList() {delete element;} 


11 ADT 方法 

bool empty() const {return element->empty();]} 
int sizel() const {return (int) element->size();} 
T& get (int theIndex) const; 

int indexOf (const T& theElement) const; 

void erase (Int theIndex); 

void insert (int theIndex, const T& theElement); 
void output (ostream& out) const; 
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// 增加 的 方法 


int capacity() const {return (int) element->capacity!();} 


/ 线性 表 的 起 始 和 结束 位 置 的 迁 代 咽 

typedef typename vector<T>::iterator iterator; 
iterator begin() {return element->begin();} 
iterator end() {return element->end();} 


protected: 1/ 增加 的 成 员 
void checkIndex (int theIndex) const; 


Vector<T>* element; // 存储 线性 表 元 素 的 向 量 





程序 5-13 ”vectorList 的 构造 函数 


template<class T> 
VectorList<T>: :VectorList (int initialCapacity) 
{1/ 构造 函数 
iE (iilOaDAGLtY < 41) 
{ostringstream S7 
s << "Initial capacity = " << initialCapacity << " Must be > 0n7 
throw illegalParameterValue(s.str()); 


} 


element = new vector<T>; 

// 创建 容量 为 0 的 空 向 量 
element->reserve (initialCapacity); 

// vector 容量 从 0 增加 到 initialcapacity 


template<class T> 
vectorList<T>: :vectorList(const vectorList<T>& theList) 


{1/ 复制 构造 函数 


element = new Vector<T> (*theList.elerment) ， 


程序 5-14 ”vectorList 的 删除 和 插入 


template<class T> 
void vectorList<T>::;erase (int theIndex) 
{1/ 删除 索引 为 theIndex 的 元 素 
/ 如 果 没 有 这 个 元 素 ， 则 扫 出 异常 
checkIndex (theIndex); 
element->erase (begin() + theIndex); 


template<class T> 
void vectorList<T>::insert (int theIndex, const Tg theElement) 
{/ 在 索引 为 theIndex 处 插入 元 素 theElement 


if (theIndex < 0 || theIndex > size()) 
{1/ 无 效 索 引 
ostringstream s; 
Ss << "index = " << theIndex << " size = " << size(); 


throw illegalIindex(s.str()); 
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element->insert (element->begin() + theIndex, theElement); 


/如果 在 重 定向 量 长 度 时 空间 不 足 ， 那 么 可 以 抛 出 没有 捕捉 的 异常 


练习 


人 
杂 度 。 测 试 你 的 代码 。 
38. 为 方法 vectorList<T>::meld(ab) ( 见 练习 28 ) 编写 代码 。 该 方法 应 该 具有 两 个 输入 线性 表 
大 小 的 线性 复杂 度 。 测 试 你 的 代码 。 
39. 为 方法 vectorList<T>::merge(a,b) ( 见 练习 29 ) 编写 代码 。 测 试 你 的 代码 。 
40. 为 方法 vectorList<T>::split(a,b) ( 见 练习 30 ) 编写 代码 。 测 试 你 的 代码 。 


5.5 在 一 个 数组 中 实现 的 多 重 表 


用 数组 描述 线性 表 有 它 的 优点 ， 很 多 线性 表 的 操作 可 以 简单 地 利用 C++ 的 方法 来 实现 。 
而 且 方 法 indexOf、remove 和 add 的 最 坏 时 间 复 杂 度 与 表 的 大 小 也 只 是 线性 关系 ， 这 是 令 人 
满意 的 时 间 性 能 。( 在 第 15 章 ， 我 们 还 会 看 到 这 种 描述 法 还 有 更 好 的 时 间 性 能 。) 

数组 描述 的 缺点 是 空间 利用 率 低 。 考 虑 下 面 一 种 情况 : 我 们 使 用 三 个 线性 表 ， 而 且 在 任 
何 时 候 ， 它 们 共同 存储 的 元 素 个 数 不 超过 4097。 然 而 很 有 可 能 在 某 一 时 刻 ， 一 张 表 的 元 素 个 
数 是 4097， 而 在 另 一 时 刻 ， 另 一 张 表 的 元 素 个 数 是 4097。 如 果 我 们 要 创建 三 个 arrayList 的 实 
例 ， 那 么 每 一 个 实例 的 初始 长 度 都 应 该 是 4097， 于 是 我 们 需要 12 291 个 元 素 的 空间 ， 尽 管 实 
了 民风 吉 亲 二 雪 丰 信条 时 仿 不 区 过 99 不 过 ， 这 样 一 来 ， 数 组 空间 不 需要 在 运行 时 段 改 
变 容量 ， 所 以 程序 执行 速度 很 快 。 可 是 换 一 种 情况 来 看 ， 如 果 三 个 数组 的 初始 长 度 是 1， 那 

a 一 个 数组 的 长 度 需 要 从 4096 增加 到 4097， 首 先 要 创建 一 个 长 度 为 8192 的 数组 ， 然 后 
把 4096 个 元 素 复制 到 新 数组 。 在 这 个 复制 过 程 中 ， 长 度 分 别 为 4096 和 8192 的 数组 都 需要 ， 
因此 至 少 需要 能 容纳 12 288 个 元 素 的 内 存 空间 。 

在 线性 表 的 很 多 应 用 中 ， 内 存 空间 的 大 小 不 是 一 个 问题 ， 因 为 计算 机 对 一 表 一 数组 的 描 
述 方法 有 足够 大 的 内 存 。 然 而 ， 如 果 使 用 很 大 的 数组 ， 即 使 总 的 元 素 并 不 多 ， 这 种 描述 方法 
也 会 因 内 存 不 足 而 失败 。 内 存 不 足 可 能 是 动态 数组 空间 分 配 失败 或 数组 长 度 加 倍 失败 所 致 。 

解决 空间 需求 问题 的 一 个 方法 是 购买 内 存 更 大 的 计算 机 。 而 另 一 个 方法 是 把 所 有 线性 
表 上 映射 到 一 个 足够 大 的 数组 element。 另 外 ， 再 用 两 个 数组 ，front 和 1last， 来 作为 数组 的 索 
引 。 图 5-3 是 用 一 个 数组 element 描述 的 三 个 表 。 约 定 是 ， 如 果 有 m 个 表 ， 那 么 表 的 编号 从 
1 至 m， 而 且 front[] 是 表 i 的 第 0 个 元 素 的 前 一 个 位 置 ( front[i] 的 这 个 约定 使 它 更 容易 表 
示 ), last[i] 是 表 i 的 最 后 一 个 元 素 的 位 置 。 依 照 这 个 约定 ， 表 非 空 时 , last[i]>front[i] ， 表 空 时 ， 
last[i]=front[i]。 在 图 5-3 的 示例 中 ， 表 2 是 空 的 。 在 数组 中 表 的 顺序 从 左 到 右 ， 从 1 到 m。 





front[1] last[1] Eront [2] frontl3] last[3] 
last[2] 


图 5-3 一 个 数组 中 的 三 个 表 
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为 了 使 第 一 个 表 和 最 后 一 个 表 的 处 理 方 法 与 其 他 表 的 处 理 方法 一 致 ， 我 们 定义 两 个 代表 
边界 的 表 ， 表 0 和 表 m+1， 其 中 ，front[0]=last[0]=-1， 们 ont[m+1l]=last[m+1]=list.length-1。 要 
在 表 i 的 索引 index 处 插入 一 个 元 素 ， 首 先 需 要 把 表 i 的 索引 为 index 的 元 素 至 最 后 的 元 素 向 
右 移 动 一 个 位 置 ， 为 新 元 素 腾 出 一 个 插入 空间 。 可 是 ， 如 果 last[i]=front[i+1]， 那 么 在 表 i 和 
表 i+1l 之 间 就 没有 可 以 移动 元 素 的 空间 。 这 时 ， 可 以 把 表 i 的 索引 0 至 索引 index-1 的 元 素 向 
左 移动 一 个 位 置 ， 前 提 是 关系 last[i-1]<front[i] 成 立 。 如 果 这 个 关系 不 成 立 ， 那 么 我 们 就 有 两 
个 选择 ， 或 者 把 表 1 至 表 i-1 中 的 一 些 表 整 个 向 左 移动 ， 或 者 把 表 计 1 至 表 m 中 的 一 些 表 向 
右 移 动 ， 以 便 使 表 i 增 大 容量 。 这 样 的 移动 是 可 能 的 ， 因 为 总 的 元 素 个 数 小 于 list.length。 

图 5-4 是 表 i 的 插入 方法 的 一 个 伪 码 。 这 个 伪 码 可 以 细 化 成 为 可 编译 的 C++ 代码 。 

void insert (int ivint index,Object element) 
(1/ 在 表 守 的 索引 index 处 插入 y 
size=last[il-front[il;/ 表 ii 的 元 素 个 数 
if (index<0||index>size) 
throw an exception; 
// 在 右面 是 否 还 有 空间 
Find the least j,j>=i,such that last[j]<front[j+1]; 
IE such a j exists, then move lists i+l through j and elements index through 


the last one of list i up one position and insert element into list i; 
This move should update appropriate last and first values. 


1/ 在 左面 是 否 还 有 空间 


IE no j was found above, then find the largest j,j<i such that 
last[j]<front[j+1]; 

IE such a j is found ,then move lists j through i-1 

and elements 1 through index-l1 of list i one position left and inser element; 
This move should update appropriate last and first values. 


1// 是 否 成 功 


if(no Jj was found above) throw an exception; 





图 5-4 在 一 个 数组 所 描述 的 三 个 表 中 插入 一 个 元 素 的 伪 码 


虽然 用 一 个 数组 描述 多 个 表 可 以 有 效 地 利用 空间 ， 但 是 插入 操作 在 最 坏 情 况 下 的 用 时 增 
加 了 。 实 际 上 ， 一 次 插 人 需要 移动 的 元 素 可 能 多 至 arrayLength-1， 其 中 arrayLength 是 线性 表 
长 度 。 而 且 用 一 个 数组 存储 多 个 表 的 方法 实现 起 来 也 是 很 麻烦 的 。 下 一 章 将 介绍 一 个 更 简单 
的 解决 方法 ， 它 对 空间 的 需求 是 所 有 元 素 所 需要 的 空间 加 上 为 每 一 个 元 素 所 配备 的 一 个 指针 
的 空间 。 


练习 


41. 把 图 5-4 细 化 为 一 个 C++ 方法 ， 然 后 测试 。 

42. 编写 一 个 C++ 方法 ,在 表 i 的 索引 index 处 插入 一 个 元 素 。 假 设 一 个 数组 描述 了 m 个 表 。 
如 果 必 须 移动 一 些 表 以 容纳 新 元 素 ， 你 要 首先 决定 有 多 少 可 用 的 空间 ， 然 后 进行 表 移 动 ， 
使 每 个 表 的 可 用 空间 大 致 相等 。 然 后 测试 你 的 代码 。 

43. 编写 一 个 C++ 方法， 在 表 i 中 删除 索引 为 index 的 元 素 。 假 设 一 个 数组 描述 了 m 个 表 。 测 
试 你 的 代码 。 











5.6 ”性 能 测量 


本 章 为 了 实现 线性 表 ， 创建 了 两 个 基于 数组 的 类 一 一 arrayList 和 vectorList。 就 空间 利用 


率 而 言 ， 


它们 有 同样 好 的 性 能 。 甚 至 它们 的 渐 近 时 间 复 杂 度 也 相同 ， 但 是 它们 的 实际 运行 时 





















































间 还 是 有 区 别 的 o VectorList 
为 了 得 到 它们 实际 的 运行 时 间 ， 我 们 必须 设计 一 i lI ja 3 

个 实验 ， 测 量 get、indexOf、erase 和 insert 操作 的 运 | 最 好 插入 | 4.02.Tms | 7.5/5.3ms 

eh . en ,4o i | 平 雹 插入 L571.Ss LS7LSS 

行 时 间 。 对 操作 get 和 indexOf， 我 们 通过 下 面 的 操作 [最 环 插入 23.512.5s | .717.58 

序列 来 测量 总 的 运行 时 间 : get(i),，0 < i<listSize 和 2 和 

indexOf(ei), 0 三 i<listSize， 其 中 ei 是 表 的 第 i 个 元 素 。 | 最 坏 删 除 2.5s 2.4s 

2 50 000 次 操作 的 时 间 


图 5-5 显示 的 是 listSize=50 000 时 的 运行 时 间 。 图 5-6 
是 以 条 形 图 显示 的 运行 时 间 。 
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| 
0 A B GC D 


A=get 操 作 

B= 数组 长 度 变 化 的 插入 
C= 数组 长 度 不 变 的 插入 
D= 删 除 操作 


图 5-5 不 同 的 线性 表 描述 方法 的 运行 时 间 








EN vectorList 
b) 平均 时 间 和 最 坏 时 间 〈 以 秒 计 ) 
图 5-6 ”运行 时 间 的 条 形 图 


arrayList 


a) 最 好 时 间 〔 以 毫秒 计 ) 


对 插入 操作 insert， 我 们 设计 的 操作 序列 是 50 000 次 插入 ， 从 空 表 开始 ， 统 计 总 的 运行 
时 间 。 最 好 的 情况 是 ， 每 次 插入 位 置 都 是 表 的 右 端 ， 最 坏 的 情况 是 ， 每 次 插入 位 置 都 是 表 的 
左 端 。 为 得 到 一 个 平均 值 ， 每 次 插入 位 置 是 随机 的 。 图 5-5 是 按 格式 T4/TB 给 出 的 插入 时 间 ， 
其 中 74 是 表 的 初始 容量 为 缺 省 值 10 的 时 候 统 计 的 时 间 ，7B 是 表 的 初始 容量 为 50 000 时 统 
计 的 时 间 。 对 类 arrayList 而 言 ， 在 最 好 的 时 候 ， 数 组 长 度 加 倍 与 数组 长 度 不 变相 比 ， 运 行 时 
间 增 加 90% 左右 。 对 类 vectorList 而 言 ， 如 果 按 照 50% 乘 数 因子 来 增加 数组 长 度 ， 那 么 在 最 
好 的 时 候 ， 数 组 长 度 增 加 与 数组 长 度 不 变相 比 ， 运 行 时 间 增 加 42% 左右 。 在 数组 长 度 改变 时 
的 总 耗费 时 间 ， 对 arrayList 而 言 是 1.9 ms， 对 vectorList 而 言 是 2.2 ms。 在 平均 和 最 坏 的 情况 
下 ， 数 组 长 度 改变 所 耗费 的 时 间 与 总 耗费 时 间 相 比 可 以 忽略 。 这 个 结果 是 我 们 所 期 望 的 ， 因 
为 数组 长 度 加 倍 和 数组 长 度 按 50% 的 乘 数 因子 增加 使 n 次 插入 的 总 时 间 增 加 8(n) ; 在 最 好 情 
况 下 的 4 次 插入 所 需要 的 时 间 是 B@(n)， 在 平均 和 最 坏 的 情况 下 ，n 次 插入 所 需 时 间 是 @(n?)。 

请 注意 ， 对 arrayList 而 言 ， 插 入 操作 的 运行 时 间 ， 从 最 好 情况 下 的 4.0 ms， 到 最 坏 情 况 
下 的 2.5 s， 增 量 是 巨大 的 ， 后 者 是 前 者 的 625 倍 。 考 虑 到 最 好 情况 的 n 次 插入 时 间 是 8(n) ; 
最 坏 情 况 的 次 插入 时 间 是 @(n*)， 这 个 增 量 并 不 特别 惊人 。 如 果 在 最 好 情况 和 最 坏 情况 的 时 





间 表 达 式 中 ， 常 数 因子 是 相同 的 (也 可 以 不 同 )， 那 么 我 们 期 望 时 间 几 乎 是 按照 n=50 000 的 
因子 增加 。 

平均 的 插入 时 间 大 约 是 最 坏 情 况 时 的 一 半 。 这 个 结果 是 在 期 望 之 中 的 ， 因 为 在 平均 情况 
下 ， 有 一 半 的 元 素 需 要 移动 ， 而 在 最 坏 的 情况 下 ， 所 有 元 素 都 需要 移动 。 

对 删除 操作 erase， 设 计 一 个 表 有 n=50 000 个 元 素 ,， 操作 序列 是 n 次 删除 。 最 好 的 情况 
是 每 次 删除 的 元 素 都 在 表 的 右 端 ， 最 坏 的 情况 是 每 次 删除 的 元 素 都 在 表 的 左 端 。 为 了 估计 一 
个 平均 值 ， 每 次 删除 的 元 素 位 置 是 随机 的 。 

对 操作 get 而 言 ，arrayList 比 vectorList 要 快 得 多 ， 这 与 最 好 情况 时 的 insert 和 erase 一 
样 。 然 而 对 操作 indexOf 而 言 ， 两 个 类 的 性 能 一 样 ， 这 与 平均 和 最 坏 情况 时 的 insert 和 erase 
一 样 。 这 个 结果 是 在 期 望 之 中 的 ， 因 为 基于 vector 类 的 操作 比 基 于 数组 的 操作 需要 更 多 的 时 
间 。 因 为 get 与 最 好 情况 时 的 insert 和 erase 一 样 ， 用 时 为 O(1)， 这 是 最 少 的 时 间 开 销 ， 它 使 
vectorList 的 性 能 相形 见 细 。 但 是 ，indexOf 与 平均 和 最 坏 时 的 insert 和 erase 一 样 ， 和 查找 或 
移动 元 素 的 操作 相 比 ， 用 时 就 很 多 了 。 

用 哪 一 个 类 更 好 呢 ? 如 果 主 要 操作 是 get， 或 者 插入 和 删除 主要 在 表 的 右 端 进行 ( 就 像 第 
8 章 的 栈 结构 一 样 )， 那 么 你 就 使 用 arrayList。 对 其 他 方面 的 应 用 而 言 ，arrayList 和 vectorL ist 
都 可 以 。 不 过 别 急 ， 我们 还 是 要 看 一 看 线性 表 的 其 他 描述 方法 ,它们 可 能 用 时 更 少 。 


练习 


44. 开发 一 个 类 arrayListNoSTL, 它 用 数组 实现 了 线性 表 。 然 而 与 类 arrayList 不 同 ， 它 没有 
利用 STL 的 任何 函数 ， 例 如 ，copy、copy backward 和 find。 重 复 本 节 的 实验 ， 获 取 
arrayList、vectorList 和 arrayListNoSTL 的 运行 时 间 。 分 别 用 表格 和 条 形 图 的 形式 表示 你 的 
结果 。 


5.7 参考 及 推荐 读物 


关于 用 C++ 描述 的 数据 结构 的 更 多 资料 请 参考 系列 教材 : 

1 ) N. Dale, Jones, Bartlett. C++ Plus Data Structures.3rd ed. Sudbury, MA, 2003. 

2 ) M. Weiss. Data Siructures and Algorithm Analysis in C++, 2nd ed. Addison-Wesley, Nenlo 
Park, CA, 1998. 

3 ) M. Goodrich, R. Tanassia, D. Mount. Data Structures and Algorithm in C++. Jhon Wiley & 
Sons, New York, NY. 2002. 

4) E. Horowitz, S$. sahni, D. Mehta. Fundamentals of Data Structures in C++. Computer Science 
Press, New York, NY, 1995. 
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线性 表 一 一 链 式 描述 





概述 


用 数组 描述 线性 表 是 很 自然 的 ， 因 此 你 可 能 以 为 没有 其 他 的 描述 方法 了 。 这 一 章 将 改变 
你 的 想法 。 

在 链 式 描述 中 ， 线 性 表 的 元 素 在 内 存 中 的 存储 位 置 是 随机 的 。 每 个 元 素 都 有 一 个 明确 的 
指针 或 链 ( 指针 和 和 链 是 一 个 意思 ) 指向 线性 表 的 下 一 个 元 素 的 位 置 ( 即 地 址 )。 

在 基于 数组 的 描述 中 ， 元 素 的 地 址 是 由 数学 公式 决定 的 。 而 在 链 式 描述 中 ， 元素 的 地 址 
是 随机 分 布 的 。 

本 章 引 入 的 数据 结构 概念 如 下 : 

e 链 式 描述 

e 链表、 循环 表 、 双 向 链表 

@ 头 节点 

STL 的 容器 类 list 使 用 带 有 头 节点 的 双向 循环 链表 来 描述 实例 。 它 的 方法 与 vector 的 方 
法 具有 相同 的 签名 和 操作 。 因 此 ， 它 的 erase 和 insert 的 签名 和 抽象 数据 类 型 linearList 的 要 
求 不 同 ， 然 而 和 vector 一 样 ， 它 可 以 用 来 设计 从 抽象 类 linearList 派生 的 具体 类 。 

这 一 章 的 应 用 部 分 有 箱子 排序 (bin sort ) ( 也 称 桶 排序 (bucket sort ) )、 基 数 排序 ( radix 
sort )、 凸 包 ( convex hull ) 和 并 查 集 ( union-find ) 问题 。 箱 子 排序 、 基 数 排序 和 并 查 集 问题 
使 用 了 链表 ， 凸 包 使 用 了 双向 链表 。 箱 子 排序 或 基数 排序 可 以 用 来 对 n 个 元 素 排 序 ， 如 果 关 
键 字 取 值 在 恰当 的 范围 内 ， 那 么 用 时 为 0(n)。 第 2 章 的 排序 方法 用 时 为 O02) ， 不 过 它们 对 关 
键 字 取 值 没有 要 求 。 并 查 集 问题 说 明了 将 整数 作为 指针 来 建立 链表 的 方法 。 


6.1 单 向 链表 


6.1.1 描述 


在 链 式 描述 中 ， 数 据 对 象 实例 的 每 一 个 元 素 都 用 一 个 单元 或 节点 来 描述 。 节 点 不 必 是 数 
组 成 员 ， 因 此 不 是 用 公式 来 确定 元 素 的 位 置 。 取 而 代 之 的 是 ， 每 一 个 节点 都 明确 包含 男 一 个 
相关 节点 的 位 置信 息 ， 这 个 信息 称 为 链 (link ) 或 指针 ( pointer )。 

设 L=(e0,e1…,en) 是 一 个 线性 表 。 在 对 这 个 线性 表 的 一 个 可 能 的 链 式 描述 中 ， 每 个 元 素 
都 在 一 个 单独 的 节点 中 描述 ， 每 一 个 节点 都 有 一 个 链 域 ， 它 的 值 是 线性 表 的 下 一 个 元 素 的 位 
置 ， 即 地 址 。 这 样 一 来 ， 元 素 e 的 节点 链接 着 元 素 em 的 节点 ，0 < i<n-1。 元素 ei 的 节 
点 没有 其 他 节点 可 链接 ， 因 此 链 域 的 值 为 NULL。 变 量 firstNode 用 来 指向 链 式 描述 的 第 1 个 
节点 。 图 6-1 是 线性 表 工 的 链 式 描述 。 链 域 的 值 用 箭头 表示 。 为 了 确定 元 素 e; 的 位 置 ， 必 须 
从 firstNode 开始 ， 从 其 中 的 链 域 找到 ei 节点 的 指针 ， 再 从 ei 节点 的 链 域 找到 e 节点 的 指针 。 
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一 般 来 说 ， 为 了 找到 索引 为 theIndex 的 元 素 ， 需 要 从 firstNode 开始 ， 跟 踪 theIndex 个 指针 才 
能 找到 。 


firstNode 


“| 


图 6-1 一 个 线性 表 的 链 式 描述 


在 图 6-1 的 链 式 描述 中 ， 每 一 个 节点 只 有 一 个 链 ， 这 种 结构 称 为 单 向 链表 ( singly linked 
list )。 链表 从 左 到 右 ， 每 一 个 节点 (最 后 一 个 节点 除外 ) 都 链接 着 下 一 个 节点 ,最 后 一 个 节 
点 的 链 域 值 为 NULL。 这 样 的 结构 也 称 为 链条 ( chain )。 

要 从 图 6-2 的 链表 中 删除 元 素 e， 需 要 以 下 步骤 ( 注意 ，e; 的 节点 是 链表 中 的 第 3 个 
节点 ): 

@ 找到 第 2 个 节点 ( 即 ei 的 节点 )。 firstNode 

。 把 第 2 个 节点 与 第 4 个 节点 链接 | 

起 来 。 

注意 ， 删 除了 图 6-2 的 第 3 个 节点 ， 其 
后 续 节 点 的 索引 自动 减 1 ( 即 删除 前 的 第 4 Lo 了 ， 
和 第 5 个 节点 ， 删 除 后 自动 成 为 第 3 和 第 图 6.2 在 5 个 节点 的 链表 中 删除 第 2 个 节点 
4 个 节点 )。 链 表 的 节点 都 是 从 firstNode 开 
始 ， 沿 着 一 系列 指针 可 以 找到 的 节点 ， 而 一 个 被 删除 的 节点 ， 从 firstNode 开始 是 不 可 能 找到 
的 ， 因 此 它 不 再 是 链表 的 节点 ， 也 就 不 用 去 修改 它 的 指针 域 。 

为 了 在 链表 中 插入 一 个 未 来 索引 为 index 的 节点 ， 需 要 首先 找到 索引 为 index-1 的 节点 ， 
然后 在 它 后 面 插入 新 节点 。 图 6-3 显示 了 在 两 种 情况 下 (index=0 和 0<index < listSize ) 实施 
删除 时 的 指针 变化 。 实 线 箭头 是 删除 前 的 指针 ， 虚 线 箭头 是 删除 后 的 指针 。 


firstNode — /> -| 省 i EE | 
1 | 二 必 























index=0 0=index< listSize 


图 6-3 ”链表 的 插入 操作 


6.1.2 ”结构 chainNode 


为 了 用 链表 描述 线性 表 ， 我 们 要 定义 一 个 结构 chainNode 和 一 个 类 chain。 程序 6-1 是 结 
构 chainNode， 它 为 图 6-1 的 节点 定义 了 数据 类 型 。 数 据 成 员 element 是 节点 的 数据 域 ， 存 储 
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表 元 素 ; 数据 成 员 next 是 节点 的 链 域 ， 存 储 下 一 个 节点 的 指针 。 
程序 6-1 链表 节点 的 结构 定义 


template <class T> 
struct chainNode 
{ 
/数据 成 员 
T element; 
chainNode<T> *next; 


// 方法 

chainNode() {} 

chainNode (const T& element) 
{this->element = element;} 

chainNode (const T& element, chainNode<T>* next) 
{this->element = element; 
this->next = next;} 

}; 


注意 ， 结 构 chainNode 的 两 个 构造 消 数 使 用 了 语法 this->element 和 this->next 来 访问 实例 
的 数据 成 员 ， 这 是 因为 实例 的 数据 成 员 与 构造 函数 的 形 参 同名 ,只 有 使 用 这 种 语法 才能 把 它 
们 区 分 开 来 。 


6.1.3 类 chain 


1. 链表 chain 的 方法 header、empty 和 size 

类 chain 用 单 向 链表 实现 了 线性 表 ， 其 中 最 后 一 个 节点 的 指针 域 为 NULL， 即 它 用 单 向 
链接 的 一 组 节点 实现 线性 表 。 程 序 6-2 是 这 个 类 的 头 、 数 据 成 员 以 及 方法 empty 和 size 的 
代码 。 


程序 6-2 链表 节点 的 结构 定义 





template<class T> 

class chain : public linearList<T> 

{ 

BablLes 

/构造 函数 ， 复 制 构造 函数 和 析 构 函数 
chain(int initialCapacity = 10); 
chain(const chain<T>&); 
~chain(); 


1/ 抽象 数据 类 型 ADT 的 方法 

bool empty() const {return listSize == 0;} 

int size() const {return listSize;} 

T& get(int theIndex) const; 

int indexOf (const T& theElement) const; 

void erase(int theIndex); 

void insert (int theIndex, const T& theElement); 
void output (ostreamg& out) const; 


protected: 
void checkIndex (int theIndex) const; 


/ 如 果 索 引 无 效 ， 抛 出 异常 





chainNode<T>* firstNode; // 指向 链表 第 一 个 节点 的 指针 
于 区 EE 了 于 训 和 和 和 加 BB 1/ 线性 表 的 元 素 个 数 
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数据 成 员 是 firstNode 和 1listSize。firstNode 是 指向 首 元 素 ( 即 线性 表 第 0 个 元 素 的 节点 ) 
节点 的 指针 。 当 链表 为 空 时 ，firstNode 的 值 为 NULL。listSize 表示 线性 表 的 元 素 个 数 ， 它 等 
于 链表 的 节点 个 数 。 

2. 构造 函数 和 复制 构造 函数 

程序 6-3 是 链表 chain 的 构造 函数 和 复制 构造 函数 。 

为 了 创建 一 个 空 链 表 ， 只 需 令 第 一 个 节点 指针 firstNode 的 值 为 NULL。 与 数组 描述 的 线 
性 表 不 同 ， 链 表 在 创建 时 不 需要 估计 元 素 的 最 大 个 数 以 分 配 初 始 空 间 。 不 过 ,构造 函数 还 是 
具有 一 个 表示 初始 容量 的 形 参 initialCapacity， 目 的 是 与 类 arrayList 相 容 。 尤 其 在 应 用 中 ， 可 
能 需要 一 个 类 型 为 linearList 的 数组 ， 对 数组 成 员 的 初始 化 将 会 用 到 如 下 所 示 的 每 一 种 形式 的 
构造 函数 。 


linearList<int>* list[10]; 
list[0]=new arrayList<int> (20)，; 
1ist[1]=new arrayList<int>(); 
list[2]=new chain<int>(5); 
list[3]=new chain<int>; 


构造 函数 的 时 间 复 杂 度 是 6(1)。 复 制 构造 函数 要 复制 链表 theList ( 原 书 为 theChain， 原 
书 有 误 一 一 译 者 注 ) 的 每 一 个 节点 ， 因 此 时 间 复 杂 度 是 O(max {ListSize, theList.listSize})。 


程序 6-3 ”链表 的 构造 函数 和 复制 构造 函数 


template<class T> 
chain<T>::chain(int initialCapacity) 
{/ 构造 函数 
if (initialCapacity < 1) 
{ostringstream s; 
s << "Initial capacity = " << initialCapacity << " Must be > 0"; 
throw illegalParameterValue(s.str()); 
} 
firstNode = NULL; 
listSize = 0; 


} 


template<class T> 
chain<T>: :chain(const chain<T>& theList) 
{1/ 复制 构造 函数 

listSize = theList.listSize; 


if (listSize == 0) 

{// 链表 theList 为 空 
firstNode = NULL; 
return; 


} 


// 链表 theList 为 非 空 
chainNode<T>* sourceNode = theList.firstNode; 


// 要 复制 链表 theList 的 节点 
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firstNode = new chainNode<T> (sourceNode->element); 
1// 复制 链表 theList 的 首 元 素 
sourceNode = sourceNode->next; 


chainNode<T>* targetNode = firstNode; 


// 当前 链表 *this 的 最 后 一 个 节点 


while (sourceNode != NULL) 
{/ 复制 剩余 元 素 


targetNode->next = new chainNoae<T> (SourceNode->element) : 
targetNode = targetNode->next; 
SourceNode = sourceNode->next; 


. 

targetNode->next = NULL; 1/ 链表 结束 
} 
3. 析 构 函数 


程序 6-4 是 链表 chain 的 析 构 函数 。 析 构 函 数 要 逐个 清除 链表 的 节点 。 实 现 的 策略 是 重 
复 清除 链表 的 首 元 素 节 点 ， 直 到 链表 为 空 。 注 意 ， 我们 必须 在 清除 首 元 素 节 点 之 前 用 变量 
nextNode 保存 第 2 个 元 素 节点 的 指针 。 析 构 函 数 的 时 间 复 杂 度 是 OUlistSize)。 


程序 6-4 ”链表 的 析 构 函数 
template<class T> 
chain<T>::~chain() 
{/ 链表 析 构 函数 . 删除 链表 的 所 有 节点 
while (firstNode != NULL) 
{// 删除 首 节点 
chainNode<T>* nextNode = firstNode->next; 
delete firstNode; 
firstNode = nextNode; 


4. 方法 get 

在 数组 描述 的 线性 表 中 ， 我 们 根据 公式 来 计算 一 个 表 元 素 的 位 置 。 然 而 在 链表 中 ， 要 寻 
找 索引 为 theIndex 的 元 素 ， 必 须 从 第 一 个 节点 开始 ， 跟 踪 链 域 next 直至 找到 所 需 的 元 素 节 点 
指针 ， 也 就 是 说 ， 必 须 跟踪 theIndex 个 指针 。 不 可 能 对 firstNode 套用 公式 来 计算 所 需 节 点 的 
位 置 。 程 序 6-5 是 方法 get 的 代码 。 其 中 的 方法 checkIndex 与 在 arrayList 中 定义 的 一 样 。 方 
法 get 的 时 间 复 杂 度 在 链表 chain 中 为 O(theIndex)， 而 在 数组 描述 的 线性 表 arrayList 中 是 
O(1), 


程序 6-5 ”方法 get 的 返回 值 是 索引 为 thelndex 的 元 素 
template<class T> 
T& chain<T>: :get (int theIndex) const 
{// 返回 索引 为 theIndex 的 元 素 
1/ 车 该 元 素 不 存在 ， 则 抛 出 异常 
CheckIndex (theInaex) : 


1// 移 向 所 需要 的 节点 
chainNode<T>* currentNode = firstNode; 
for (int i = 0; i < theIndex; i++) 


currentNode = currentNode->next; 
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return currentNode->element; 
} 


5. 方法 indexOf 

程序 6-6 是 方法 chain<T>::indexOf 的 代码 。 它 与 arrayList<T>::indexOf 的 代码 不 同 ， 主 
要 体现 在 从 一 个 元 素 寻 找 下 一 个 相 邻 元 素 的 方式 上 面 。 在 数组 描述 的 线性 表 中 ， 我 们 根据 当 
前 元 素 的 位 置 ， 套 用 公式 来 计算 下 一 个 相 邻 元 素 的 位 置 ( 当 使 用 方程 5-1 时 ， 当 前 位 置 加 1 
便 是 下 一 个 元 素 的 位 置 )。 在 链表 描述 的 线性 表 中 ， 唯 一 的 方法 是 用 当前 节点 的 指针 确定 下 一 
个 相 邻 节点 的 位 置 。chain<T>::indexOf 的 时 间 复 杂 度 是 O(listSize)。 





程序 6-6 ”返回 元 素 theElement 首次 出 现时 的 索引 


template<class T> 
int chain<T>::indexOf (const T& theElement) const 
{ /返回 元 素 theElement 首次 出 现时 的 索引 

1/ 若 该 元 素 不 存在 ， 则 返回 -1 





// 搜索 链表 寻找 元 素 theElement 


chainNode<T>* currentNode = firstNode; 


int index = 0; 1/ 当前 节点 的 索引 
While (currentNode != NULL && 
currentNode->element != theElement) 


{ 
1/ 称 向 下 一 个 节点 


currentNode = currentNode->next,; 


indext++; 
} 
/确定 是 否 找到 所 需 的 元 素 
if (currentNode == NULL) 


return -1; 
else 
return index; 


} 


6. 方法 erase 

程序 6-7 是 方法 erase 的 代码 ， 它 删除 索引 为 theIndex 的 元 素 。 需 要 考虑 三 种 情况 : 

e@ theIndex<0 或 者 theIndex = listSize。 这 时 ， 删 除 操 作 无 效 ， 因 为 没有 这 个 位 置 上 的 元 

素 。 这 种 情况 可 能 表示 链表 为 空 。 

e 删除 非 空 表 的 第 0 个 元 素 节 点 。 

e 删除 其 他 元 素 节 点 。 

为 了 理解 程序 6-7， 画 出 空 表 以 及 至 少 含有 一 个 元 素 的 链表 。 另 外 ， 画 出 下 列 各 种 情况 下 
的 删除 操作 : theIndex<0，theIndex=0( 删除 第 0 个 元 素 节 点 )，theIndex=listSize-1 ( 删除 最 后 
的 元 素 节 点 )，theIndex = listSize 和 0<theIndex<listSzie-1( 删除 内 部 节点 )。 

chain<T>::erase 的 时 间 复 杂 度 是 O(theIndex)， 而 arrayList<T>::erase 的 时 间 复 杂 度 是 
O(listSize-theIndex)。 因 此 在 接近 表 头 的 位 置 实施 删除 操作 时 ， 链 式 描述 的 线性 表 比 数组 描述 
的 线性 表 有 更 好 的 时 间 性 能 。 
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程序 6-7 删除 索引 为 thelndex 的 元 素 


template<class T> 

void chain<T>: :erase (int theIndex) 
{// 删除 索引 为 theIndex 的 元 素 

1/ 车 该 元 素 不 存在 ， 则 抛 出 异常 


checkIndex (theIndex); 


/索引 有 效 ， 需 找 要 删除 的 元 素 节 点 
chainNode<T>* deleteNode,; 
if (theIndex == 0) 
{W 删除 链表 的 首 节点 
deleteNode = firstNode; 
firstNode = firstNode->next; 
} 
else 
{ WU/ 用 指针 pp 指向 要 删除 节点 的 前 驱 节点 
chainNode<T>* p = firstNode; 
for (Ent 三 0; 4 < thelndex = 17 ++) 
P = p->next; 


deleteNode = p->next; 
p->next = p->next->next; // 删除 deleteNode 指向 的 节点 


} 
listSize——;} 
delete deleteNode; 


7. 方法 insert 

插入 和 删除 的 过 程 很 相似 。 为 了 在 链表 中 索引 为 theIndex 的 位 置 上 插入 一 个 新 元 素 ， 需 
要 首先 找到 索引 为 theIndex-1 的 元 素 节点 ， 然 后 在 该 节点 之 后 插 人 新 元 素 节点 。 程 序 6-8 是 
这 个 操作 的 代码 。 它 的 时 间 复 杂 度 为 O(theIndex)。 


程序 6-8 ”插入 元 素 theElement 并 使 其 索引 为 thelndex 


template<class T> 
void chain<T>::insert (int theIndex, const T& theElement) 


{/ 在 索引 为 theIndex 的 位 置 上 插入 元 素 theElement 


if (theIndex < 0 |1| theIndex > listSize) 
{/ 无 效 索引 
ostringstream S7 
Ss << "index = " << theIndex << " size = " << listSize; 


throw illegalIndex(s.str()); 


if (theIndex == 0) 

/在 链表 头 插 入 

firstNode = new chainNode<T> (theElement, firstNode); 
else 


{ /寻找 新 元 素 的 前 驱 
chainNode<T>* p = firstNode; 
for (int i = 0; i < theIndex - 1; i++) 
p = p->next; 


1// 在 pp 之 后 插入 





p->next = new chainNode<T> (theElement, p->next); 


i 
listSizet++? 


} 


8. 输出 链表 

程序 6-9 既是 对 输出 方法 output 的 实现 ， 又 是 对 流 插入 符 << 的 重 载 。chain<T>::output 
与 arrayList<T>::output 不 同 ， 主 要 在 于 它 从 一 个 节点 向 另 一 个 节点 移动 时 使 用 了 指针 next。 
不 过 ， 两 者 的 时 间 复 杂 度 一 样 ， 都 是 OUistSize)。 


程序 6-9 方法 output 


template<class T> 
void chain<T>::output (ostream& out) const 
{// 把 链表 放 入 输出 流 
for (chainNode<T>* currentNode = firstNode; 
currentNode != NULL; 
currentNode = currentNode->next) 
out << currentNode->element << ™ "; 
} 
// 重 载 << 
template <class T> 
Ostream& operator<<(ostream& out, const chain<T>& x) 
{x.output (out); return out;} 


9. 链表 的 成 员 类 iterator 

在 单 向 链表 中 ,使 用 指针 next， 我 们 能 很 快 地 从 一 个 节点 找到 它 的 后 继 。 但 是 我 们 
不 能 从 一 个 节点 很 快 地 找到 它 的 前 驱 。 因 为 对 单 向 链表 ， 只 能 定义 一 个 向 前 迭代 器 。 而 对 
arrayList 类 ， 我 们 定义 了 一 个 双向 迭代 器 ， 很 容易 就 能 从 任何 一 个 元 素 移 到 它 的 后 继 和 前 驱 ， 
时 间 仅 为 O(1)。 程 序 6-10 是 链表 的 一 个 向 前 迭代 器 的 部 分 代码 。 完 整 的 代码 可 以 从 本 书 网 站 
上 得 到 。 


程序 6-10 ”和 迭代 器 类 chain<T>::iterator 


class iterator 
{ 
BBLlic: 
// 向 前 迭代 器 所 需要 的 typedef 语句 在 此 省 略 


// 构造 函数 
iterator (chainNode<T>* theNode = NULL) 
{node = theNode;} 


/ 解 引 用 操作 符 
T& operator*() const {return node->elLermenty } 
T* operator->() const {return &node->element;} 
/和 迭代 器 加 法 操作 
iterator& operator++() 1/ 前 加 

{node = node->next; return *this;} 
iterator OPerator++ (int) 1/ 后 加 


{iterator old = *this; 
node = node->next; 
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return old; 
} 


1/ 相等 检验 
bool operator!=(const iterator right) const 
{return node != right.node;} 
bool operator==(const iterator right) const 
{return node == right.node;]} 


protected: 
chainNode<T>* node; 


js 


方法 chain<T>::begin 和 chain<T>::end 的 定义 如 下 : 


iterator begin(){return iterator (firstNode);} 
iterator end() {return iterator (NULL);)} 


在 链表 chain 中 ， 从 左 至 右 的 访问 线性 表 的 元 素 时 ， 使 用 get 方法 和 使 用 迭代 器 方法 ,在 
运行 时 间 上 的 差别 是 很 大 的 。 使 用 get 方 法 访问 第 i 个 元 素 的 时 间 是 6(i)。 因 此 ， 如 果 一 次 考 
察 一 个 元 素 ，get 方法 的 总 时 间 是 @(listSize”)。 而 迭代 器 方法 的 时 间 仅 为 @(listSize)。 


6.1.4 抽象 数据 类 型 linearList 的 扩充 


在 线性 表 的 一 些 应 用 中 ,除了 抽象 数据 类 型 linearList ( 见 ADT 5-1 ) 所 具有 的 操作 外 ， 
还 需要 另外 一 些 操作 ， 因 此 需要 扩展 ADT 使 其 包含 这 些 操作 ， 诸 如 clear( 清除 表 的 所 有 元 素 ) 
和 push_back(theElement) ( 将 元 素 theElement 插入 表 尾 )。 程 序 6-11 给 出 了 扩展 后 的 抽象 类 。 


程序 6-11 对 扩展 的 线性 表 的 抽象 类 


template<class T> 
class extendedLinearList : linearList<T> 
{ 
Public: 
virtual ~extendedLinearList() {} 
virtual void clear() = 0; 
// 清 表 
Virtual void push back(const T& theElement) = 0; 
// 将 元 素 theElement 插 到 表 尾 


6.1.5 类 extendedChain 


我 们 将 开发 一 个 类 extendedChain， 以 作为 抽象 类 extendedLinearList 的 链 式 描述 。 而 开 
发 的 捷径 是 从 链表 chain 派生 。 

为 了 在 链表 的 末端 最 快 地 插入 一 个 元 素 ， 我们 增加 一 个 数据 成 员 lastNode， 它 是 指向 链 
表 尾 节点 的 指针 。 利 用 这 个 指针 ， 可 以 把 新 元 素 直 接 附 加 在 链表 后 面 ， 时 间 是 6(1)。 但 是 这 
个 新 的 数据 成 员 lastNode 有 时 需要 修改 ， 因 为 在 删除 和 插入 时 可 能 会 改变 尾 节点 ， 这 时 就 要 
更 新 指向 尾 节 点 的 指针 lastNode。 因 此 ,设计 类 extendedChain 需要 完成 的 工作 有 : 声明 一 个 
数据 成 员 lastNode; 提供 改进 的 erase 和 insert 代码 ; 定义 在 linearList 中 剩余 的 纯 虚 函数 ， 使 
其 调用 类 chain 的 相应 方法 ; 实现 方法 clear 和 push_back。 
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程序 6-12 是 方法 clear 和 push_back 的 代码 。 而 类 extendedChain 的 完整 代码 可 以 从 本 书 
网 站 上 得 到 。 


程序 6-12 类 extendedChain<T> 的 方法 clear 和 push_back 


template<class T> 
void extendedChain<T>:: clear() 
{/ 删除 链表 的 所 有 节点 
while (firstNode != NULL) 
{1/ 删除 节点 人 rstNode 
chainNode<T>* nextNode = firstNode->next; 
delete firstNode; 
firstNode = nextNode; 





h 
listSize = 0; 
} 


template<class 'T> 
void extendedChain<T>::push back(const T& theElement) 
{// 在 链表 尾 端 插入 元 素 theElement 的 节点 
chainNode<T>* newNode = new chainNode<T> (theElement, NULL); 
if {firstNode == NULL) 
// 链表 为 空 
firstNode = lastNode = newNode; 
else 
{ VW 把 新 元 素 节点 附加 到 lastNode 指向 的 节点 
lastNode->next = newNode; 
lastNode = newNode; 
} 
listSizett;} 


6.1.6 性 能 测量 


1. 内 存 比 较 

在 数组 描述 的 线性 表 中 ， 当 数组 满 时 ， 数 组 长 度 加 倍 。 我 们 希望 ， 当 数组 空间 占有 率 不 
足 25% 时 ， 数 组 长 度 要 减 半 ( 注意 ，STL 的 容器 类 vector 是 按照 乘 数 因 子 1.5 来 增加 数组 长 
度 的 ， 而 且 和 我 们 现在 定义 的 数组 线性 表 类 一 样 ， 从 来 不 减少 数组 长 度 )。 因 此 ， 上 有 具有 ?个 
元 素 的 线性 表 可 以 存储 在 一 个 长 度 介 于 nn 和 4n 之 间 的 数组 中 。 这 样 的 数组 空间 也 可 用 于 元 
素 个 数 在 n 和 4n 之 间 的 线性 表 。 当 用 链表 来 描述 线性 表 时 ，n 个 元 素 正 好 分 配 了 nn 个 节点 空 
间 ， 每 个 节点 有 两 个 域 。 因 此 ， 链 表 描 述 需 要 n 个 元 素 空 间 和 n 个 指针 空间 。 假 设 一 个 元 素 
需要 字 节 ， 一 个 指针 需要 4 字 节 。 忽 略 数据 成 员 size 和 firstNode 所 需要 的 字 节 数 ， 对 个 
元 素 的 线性 表 ， 数 组 描述 所 需要 的 字 节 数 在 ns 和 4ns 之 间 ， 而 链表 描述 所 需要 的 字 节 数 是 
n(s+4)。 因 此 ,大 多 数 的 应 用 设计 在 选择 线性 表 的 描述 方法 时 ， 空 间 需 求 上 的 差异 不 是 决定 
因素 。 

2. 运行 时 间 比 较 

在 时 间 需 求 方面 ， 我 们 预计 chain<T>::get 比 arrayList<T>::get 要 慢 得 多 ， 因 为 chain<T>::get 
的 时 间 复 杂 度 是 OUlistSize)， 而 arrayList<T>::get 的 时 间 复 杂 度 是 8(1)。 这 一 数据 是 由 实验 证 
实 了 。 在 一 个 空 链表 的 左 端 连续 插入 ， 建 立 起 一 个 50 000 个 节点 的 链表 。 然 后 实施 50 000 次 
get 操作 get(i)，0 三 i<50 000。chain<T>::get 的 总 耗 时 为 13.2 s。 而 arrayList<T>::get 的 总 耗 
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时 为 1.0 ms， 这 使 链表 相形 见 纳 。 比 较 indexOf、insert 和 erase 的 耗 时 ， 链 表 的 情况 也 不 好 。 
图 6-4 和 图 6-5 显示 的 是 arrayList 和 chain 在 实施 5.6 节 的 系列 操作 时 所 使 用 的 时 间 。 执 
行 50 000 次 的 indexOf 操 作 ，chain<T>::indexOf 的 用 时 























大 约 是 arrayList<T>::indexOf 的 6 倍 。 在 平均 情况 下 的 插 8 
入 和 删除 操作 ， 链 表 chain 的 用 时 大 约 分 别 是 数组 最 好 插入 Tl ms |45.1 ms 
arrayList 的 33 倍 和 46 倍 。 最 坏 皇 入 2 | 2 
即使 在 最 坏 的 情况 下 ， 对 链表 实施 一 系列 的 插入 和 人 | re 
删除 操作 在 链表 的 右 端 插入 和 删除 ) 所 做 的 工作 最 多 ， ”上 | 最 坏 删除 25s | 129s 
但 是 因为 高 速 缓存 的 作用 ( 见 4.5 节 )， 其 相应 的 运行 时 50 000 次 操作 的 时 间 
间 不 一 定 是 最 多 的 。 事 实 上 ， 你 会 发 现 ， 最 坏 情况 下 的 。 图 6-4 ”不 同 的 线性 表 描述 方法 的 
运行 时 间 比 平均 情况 下 的 要 小 。 操作 记 时 


在 平均 情况 下 实施 插入 操作 ,链表 的 插入 位 置 是 随 
机 的 。 因 而 ， 在 链表 中 相 邻 的 节点 在 内 存 中 的 位 置 是 随 
机 的 。 于 是 ， 当 你 在 链表 中 从 左 至 右 移 动 时 ， 你 访问 的 
内 存 是 随机 的 。 这 就 导致 了 很 多 的 高 速 缓存 缺失 。 对 平 
均 情况 下 的 删除 实验 ， 结 果 也 是 如 此 ， 因 为 所 用 的 链表 
是 随机 构建 的 。 而 最 坏 情 况 的 实验 是 连续 在 链表 的 右 端 
执行 插入 操作 。 这 样 设计 的 实验 ， 使 连续 调用 的 操作 符 
new 所 生成 的 节点 ， 不 仅 在 链表 中 是 相 邻 的 ， 在 内 存 中 
也 是 相 邻 的 。 因 此 ， 当 你 在 链表 中 从 左 至 右 移动 时 ， 你 
访问 的 内 存 是 相 邻 的 ， 这 是 高 速 缓 存 管理 机 制 所 青睐 的 
一 种 内 存 访 问 模式 。 高 速 缓存 缺失 的 数量 由 此 而 减少 。 
这 样 就 产生 了 一 种 异常 现象 ， 对 插入 和 删除 的 操作 性 能 
实验 ， 在 最 坏 情 况 下 的 用 时 比 在 平均 情况 下 的 用 时 要 少 。 

对 chain<T>::get 和 chain<T>::indexOf 的 操作 性 能 实 
验 ， 采用 的 是 在 链表 头 连续 插入 而 生成 的 链表 ( 在 最 好 情况 下 插入 生成 的 链表 )， 因 此 ， 在 实 
验 所 用 的 链表 中 ， 相 邻 的 节点 在 内 存 中 也 是 相 邻 的 。 期 望 的 是 ， 在 随机 插 和 人 所 生成 的 链表 中 ， 
实施 同样 的 get 和 indexOf 操作 序列 ， 将 耗费 更 多 的 时 间 。 事 实 上， 在 分 别 的 实验 中 ， 它 们 的 
耗 时 分 别 是 167s 和 165s。 连 续 50 000 次 的 get 操作 实验 ， 实 验 所 用 的 链表 一 个 是 随机 插入 生 
成 的 ， 另 一 个 是 在 最 好 情况 下 插 人 生成 的 ， 前 者 耗 时 是 后 者 的 13 倍 。 这 个 比率 对 indexOf 操 
作 实 验 来 说 是 一 样 的 。 就 线性 表 的 标准 操作 而 论 ， 链 表 描 述 的 性 能 令 人 失望 。 

注意 ,在 数组 描述 的 线性 表 中 ， 我 们 利用 高 速 缓 存 效果 来 比较 最 好 情况 、 平 均 情况 和 最 
坏 情况 的 操作 时 间 ( 见 5.6 节 )， 这 是 因为 ， 在 所 有 测试 中 ， 数 组 元 素 不 仅 是 从 左 至 右 连续 访 
问 的 ， 而 且 在 内 存 中 也 是 连续 存放 的 。 

3. 指针 有 什么 好 处 

你 大 概 会 奇怪 ， 为 什么 要 花 那 么 多 时 间 来 研究 指针 呢 ? 在 第 15 章 ， 我 们 要 创建 平衡 二 又 
树 结构 ， 诸 如 AVL 和 红 黑 树 。 这 些 结构 的 索引 版 ( 例如 索引 AVL 树 ) 可 以 描述 线性 表 ( 见 
练习 15， 练习 20 )。 它 们 使 用 了 指针 ， 而 且 就 最 坏 情 况 的 插入 和 删除 而 言 ， 它 们 击败 了 数组 
描述 的 线性 表 arrayList。 

尽管 链表 描述 的 线性 表 在 计时 实验 中 表现 不 好 ， 但 是 在 若干 个 线性 表 的 应 用 中 ， 它 比 数 





0 arrayList [二 三 三 chain 
图 6-5 平均 和 最 坏 情 况 的 操作 记 时 ， 
时 间 单 位 是 秒 ， 操 作 数 50 000 
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组 描述 的 线性 表 更 有 效 。6.5 节 给 出 这 样 一 些 应 用 实例 。 这 些 实例 需要 我 们 把 多 个 表 合 并 为 一 
个 表 ， 或 者 在 删除 或 插入 一 个 节点 时 要 知道 它 的 前 驱 。 

把 一 个 链表 的 尾 节点 和 另 一 个 链表 的 首 节点 链接 起 来 ， 两 个 链表 可 以 合并 为 一 个 链表 。 
如 果 我 们 知道 一 个 链表 的 首尾 节点 ， 合 并 的 用 时 为 0(1)。 要 把 两 个 数组 描述 的 线性 表 合 并 为 
一 个 ， 必 须 把 第 二 个 表 复 制 到 第 一 个 表 的 数组 中 。 这 种 复制 耗 时 @(size of second list)。 当 我 
们 知道 一 个 节点 的 前 驱 ， 链表 的 删除 和 插入 操作 的 用 时 为 0(1) ; 而 这 种 操作 在 数组 描述 的 线 
性 表 中 需 用 时 OUlist size)。 


练习 


1. 令 L=(a,b,c,d,e) 是 一 个 线性 表 ， 且 用 链表 描述 。 模 仿 图 6-1 做 图 ， 显 示 在 下 面 的 每 一 个 操作 
之 后 的 链表 : 初始 状态 ，insert(0,f)，insert(3,g)，insert(7,h)，erase(0)，erase(4)。 

2. 编写 方法 chain<T>::setSize(int theSize)， 它 使 线性 表 的 大 小 等 于 theSize。 若 初始 线性 表 的 
大 小 小 于 theSize， 则 不 增加 元 素 。 若 初始 线性 表 的 大 小 大 于 theSize， 则 删除 多 余 的 元 素 。 
计算 方法 的 复杂 度 。 测 试 你 的 代码 。 

3. 编写 方法 chain<T>::set(theIndex,theElement)， 它 用 元 素 theElement 替换 索引 为 theIndex 的 
元 素 。 若 索引 theIndex 超出 范围 ， 则 抛 出 异常 。 计 算 方法 的 复杂 度 。 测 试 你 的 代码 。 

4. 编写 方法 chain<T>::removeRange(fromIndex,toIndex)， 它 删除 指定 索引 范围 内 的 所 有 元 素 。 
计算 方法 的 复杂 度 。 测 试 你 的 代码 。 

5. 编写 方法 chain<T>::lastIndexOf(theElement)， 返 回 值 是 指定 元 素 最 后 出 现时 的 索引 。 若 这 
样 的 元 素 不 存在 ， 则 返回 -1。 计 算 方法 的 复杂 度 。 测 试 你 的 代码 。 

6. 重 载 操作 符 []， 使 得 表达 式 x[i] 返回 对 链表 x 的 第 i 个 元 素 的 引用 。 若 链表 没有 第 i 个 元 素 ， 
则 抛 出 异常 legalIndex。 语句 x[] =y 和 y=x[i] 按 以 往 预 期 的 方式 执行 。 测 试 你 的 代码 。 

7. 重 载 操作 符 ==， 使 得 表达 式 x==y 返回 true， 当 且 仅 当 两 个 链表 x 和 y 相等 ， 即 对 所 有 的 
i， 两 个 链表 的 第 i 个 元 素 相 等 。 测 试 你 的 代码 。 

8. 重 载 操 作 符 !=， 使 得 表达 式 xl=y 返回 true， 当 且 仅 当 两 个 链表 x 和 y 不 等 ( 见 练习 7 )。 测 
试 你 的 代码 。 

9. 重 载 操 作 符 <， 使 得 表达 式 x<y 返回 tue， 当 且 仅 当 链 表 x 按 字典 顺序 小 于 链表 y ( 见 练习 
7)。 测 试 你 的 代码 。 

10. 编写 方法 chain<T>::swap(theChain)， 它 交换 链表 元 素 *this 和 theChain。 计 算 方法 的 复杂 

度 。 测 试 你 的 代码 。 

11. 编写 一 个 方法 ， 它 把 数组 线性 表 转 换 为 链表 。 这 个 方法 既 不 是 类 arrayList 的 成 员 函 数 ， 也 
不 是 类 chain 的 成 员 函 数 。 使 用 类 arrayList 的 方法 get 和 类 chain 的 方法 insert。 计 算 方法 
的 复杂 度 。 测 试 你 的 代码 。 

12. 编写 一 个 方法 ， 它 把 链表 转换 为 数组 线性 表 。 这 个 方法 既 不 是 类 arrayList 的 成 员 函 数 ， 也 
不 是 类 chain 的 成 员 范 数 。 

1 ) 使 用 类 chain 的 get 方法 和 1listSize 方法 ， 类 arrayList 的 insert 方法 。 计 算 方 法 的 复杂 
度 。 测 试 你 的 代码 。 
2 ) 使 用 链表 和 迭代 带 。 计 算 方法 的 复杂 度 。 设 计数 据 测试 你 的 代码 。 

13. 在 类 chain 中 增加 转换 方法 。 一 个 方法 是 fromList(theList)， 它 把 数组 线性 表 theList 转换 

为 链表 。 另 一 个 方法 是 toList(theList)， 它 把 链表 *this 转换 为 数组 线性 表 theList。 计 算 方 
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法 的 复杂 度 。 测 试 你 的 代码 。 


. 1 ) 编写 方法 chain<T>::leftShift(i)， 它 将 表 中 的 元 素 向 左 移动 i 个 位 置 。 如 果 1=[0,1,2,3,4]， 


那么 LleftShift(2) 的 结果 是 1=[2,3,4]。 
2 ) 计算 方法 的 复杂 度 。 
3 ) 测试 你 的 代码 。 


. 1 ) 编写 方法 chain<T>::reverse， 它 颠倒 *this 中 的 元 素 的 顺序 ， 而 且 原 地 完成 ， 不 用 分 配 


任何 新 的 节点 空间 。 
2 ) 计算 方法 的 复杂 度 。 
3 ) 使 用 自己 的 测试 数据 检验 方法 的 正确 性 。 


. 编写 一 个 非 成 员 方 法 ， 它 使 用 chain 的 成 员 方法 来 颠倒 链表 的 元 素 。 计 算 方 法 的 复杂 度 。 


测试 你 的 方法 。 


. 令 a 和 bb 的 类 型 为 extendedChain。 


1 ) 编写 一 个 非 成 员 方 法 meld， 它 生成 一 个 新 的 扩展 的 链表 c， 它 从 a 的 首 元 素 开 始 ， 交 
蔡 地 包含 a 和 的 元 素 。 如 果 一 个 链表 的 元 素 取 完了 ， 就 把 另 一 个 链表 的 剩余 元 素 附 
加 到 新 的 扩展 链表 c 中 。 方法 的 复杂 度 应 与 链表 a 和 的 长 度 具 有 线性 关系 。 

2 ) 证 明 方法 具有 线性 复杂 度 。 

3 ) 使 用 自己 的 测试 数据 检验 方法 的 正确 性 。 


. 编写 方法 chain<T>::meld。 它 与 练习 17 的 方法 meld 类 似 。 然 而 ，a 和 b 以 及 合并 结果 ， 


都 是 chain<T> 类 型 。 合 并 后 的 链表 使 用 的 应 该 是 链表 a 和 的 节点 空间 。 合 并 之 后 ， 输 
入 链表 a 和 b 是 空 表 。 

1 ) 编写 方法 meld， 其 复杂 度 应 该 与 给 入 链表 的 长 度 具 有 线性 关系 。 

2 ) 证 明 方法 具有 线性 复杂 度 。 

3 ) 测试 代码 的 正确 性 。 使 用 自己 的 测试 数据 。 


. 令 a 和 b 的 类 型 为 extendedChain。 假 设 a 和 b 的 元 素 类 型 都 定义 了 操作 符 <、>、<=、 


>=、== 和 !=。 而 且 假设 a 和 b 是 有 序 链表 ( 从 左 至 右 非 逆 减 )。 

1 ) 编写 一 一 个 非 成 员 方 法 merge， 它 生成 一 个 新 的 有 序 链表 c， 包含 a 和 b 的 所 有 元 素 。 

2 ) 计算 方法 的 复杂 度 。 

3 ) 使 用 自己 的 测试 数据 检验 方法 的 正确 性 。 

重 做 练习 19， 但 是 编写 的 是 方法 chain<T>::merge。 归 并 之 后 ， 两 个 输入 链表 a 和 bb 为 空 。 


. 令 ec 的 类 型 为 扩展 链表 extendedChain。 


1 ) 编写 一 个 非 成 员 方 法 split(a,b)， 它 生成 两 个 扩展 链表 a 和 b。a 包含 c 中 索引 为 奇数 的 
元 素 ，b 包含 c 中 其 余 的 元 素 。 这 个 方法 不 能 改变 c。 

2 ) 计算 方法 的 复杂 度 。 

3 ) 使 用 自己 的 测试 数据 检验 方法 的 正确 性 。 

编写 方法 chain<T>::split， 它 与 练习 21 的 函数 类 似 。 然 而 ， 它 用 输入 链表 *this 的 空间 建 

立 了 链表 a 和 b。 


. 在 一 个 循环 移动 的 操作 中 ， 线 性 表 的 元 素 根据 给 定 的 值 ， 按 顺 时 针 方 向 移动 。 例 如 


L=[0,1,2,3,4]， 循 环 移动 2 的 结果 是 L=[2,3,4,0,1]。 
1 ) 编写 方法 extendedChain<T>::circularShift(i)， 它 将 线性 表 的 元 素 循环 移动 i 个 位 置 。 
2 ) 测试 你 的 代码 。 
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24. 令 theChain 是 一 个 链表 。 假 定向 链表 右 端 移动 ， 首 转 指 针 方向 。 当 移动 到 节点 p 时 ， 链 表 
被 划分 为 两 个 链表 。 一 个 链表 从 节点 p 开始 ， 向 前 到 最 后 一 个 节点 。 男 一 个 从 p 的 前 驱 节 
点 1 开始 ， 向 后 到 首 节点 。 初 始 时 ，p=theChain.firstNode，l=NULL。 

1 ) 一 个 链表 有 6 个 节点 ， 当 p 是 第 三 个 节点 ，1 是 第 二 个 节点 时 ， 画 出 链表 的 布局 。 

2 ) 开发 类 moveLeftAndRightOnChain。 其 构造 函数 初始 化 数据 成 员 p 和 1。 其 公有 方法 
moveRight 一 一 将 p 和 1 向 右 移动 一 个 节点 ，moveLeft 一 一 将 p 和 1 向 左 移动 一 个 节点 ， 
currentElement 一 一 返回 节点 p 的 元 素 ，previousElement 一 一 返回 节点 | 的 元 素 。 

3 ) 用 适当 的 数据 测试 你 的 代码 。 

. 应 用 练习 24 的 思想 ， 对 程序 6-2 的 类 chain 开发 一 个 新 版 本 。 使 用 这 个 新 链表 可 以 很 快 
地 前 后 移动 ， 而 且 实现 linearList 方 法， 即使 像 练 习 24 所 描述 的 那样 将 链表 分 裂 为 两 个 链 
表 。 为 此 ， 增 加 练习 24 中 的 数据 成 员 p 和 1， 增 加 下 列 公 有 方法 : 

1 ) reset 一 一 令 p 为 firstNode, 1 为 NULL。 

2 ) current() 一 一 返回 p 指向 的 元 素 ; 若 操 作 失 败 ， 则 抛 出 异常 。 

3 ) attend 一 一 车 p 指向 链表 的 最 后 一 个 元 素 ， 则 返回 true， 否 则 ， 返 回 false。 

4 ) atFront 一 一 若 p 指向 链表 的 第 一 个 元 素 ， 则 返回 true， 否 则 ， 返 回 false。 

5 ) moveToNext 一 一 将 p 和 1 向 前 移动 一 个 节点 。 若 操作 失败 ， 则 抛 出 异常 。 

6 ) moveToPrevious 一 一 将 p 和 1 向 后 移动 一 个 节点 。 若 操作 失败 ， 则 抛 出 异常 。 

为 了 有 效 地 实现 insert、erase 和 indexOf， 再 增加 一 个 数据 成 员 currentElement 是 有 用 的 ， 
它 是 p 所 指向 的 元 素 的 索引 。 用 适当 的 测试 数据 检验 代码 的 正确 性 。 
26. 编写 方法 chain<T>::insertSort， 它 使 用 插入 排序 ( 见 程序 2-15 ) 对 链表 按 非 递减 顺序 重新 排序 。 
不 开发 新 的 节点 ， 也 不 删除 老 的 节点 。 可 以 假设 元 素 的 类 型 定义 了 关系 操作 符 (<、> 等 )。 
1 ) 方法 在 最 坏 情 况 下 的 复杂 度 是 多 少 ? 如 果 元 素 已 经 有 序 ， 那么 该 方法 需要 多 少时 间 ? 
2 ) 使 用 自己 的 测试 数据 检验 方法 的 正确 性 。 

27. 对 如 下 的 排序 方法 ( 见 第 2 章 的 描述 ) 重 做 练习 26: 
1 ) 冒 泡 排序 。 
2 ) 选择 排序 。 
3 ) 计数 排序 或 排列 排序 。 


6.2 ”循环 链表 和 头 节点 


下 面 有 两 条 措施 ， 它 们 可 以 使 链表 的 应 用 代码 简洁 和 高 效 : 1 ) 把 线性 表 描 述 成 一 个 单 向 
循环 链表 ( singly linked circular list ) ( 简称 循环 链表 )， 而 不 是 单 向 链表 ; 2 ) 在 链表 的 前 面 增 
加 一 个 节点 ， 称 为 头 节点 (header node )。 只 要 将 单 向 链表 的 尾 节 点 与 头 节点 链接 起 来 ， 单 向 
链表 就 成 为 循环 链表 ， 如 图 6-6a 所 示 。 图 6-6b 是 一 个 带 有 头 节点 的 非 空 循环 链表 。 图 6-6c 
是 一 个 带 有 头 节 点 的 空 循环 链表 。 

使 用 头 节点 的 链表 非常 普遍 ， 这 样 可 以 使 程序 更 简洁 、 运 行 速度 更 快 。 假 定 类 
circularListWithHeader 是 带 有 头 节点 的 循环 链表 。 程 序 6-13 是 其 构造 函数 和 indexOf 方法 的 
代码 。 构 造 函 数 创 建 了 空 表 ( 如 图 6-6c )。 构 造 函 数 的 时 间 复 杂 度 是 86(1)，indexOf 方法 的 时 
间 复 杂 度 是 OUlistSize)。 虽 然 chain<T>::indexOf 和 circularListWithHeader<T>::indexOf 具有 相 
同 的 时 间 复 杂 度 ， 但 是 后 者 的 代码 更 简单 。 因 为 不 需要 在 while 循环 语句 中 对 每 一 个 迭代 器 
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检查 条 件 currentNode!=NULL， 所 以 运行 也 更 快 一 些 ， 除 非 要 查找 的 元 素 紧 靠 表 头 。 


图 


a) 循环 链表 





firstNode _ 








headerNode 
headerNode ， 


b) 有 头 节点 的 循环 链表 
图 6-6 循环 链表 











程序 6-13 ”搜索 带 有 头 节点 的 循环 链表 


template<class T> 
circularListWithHeader<T>::circularListWithHeader () 
{// 构造 函数 

headerNode = new chainNode<T>(); 

headerNode->next = headerNode; 

listSize = 0; 


template<class T> 

int circularListWithHeader<T>::indexOf (const T& theElement) const 
{/ 返回 元 素 theBlement 首次 出 现 的 索引 

1/ 车 该 元 素 不 存在 ， 则 返回 -1 


// 将 元 素 theBlement 放 入 头 节点 
headerNode->element = theElement; 


// 在 链表 中 搜索 元 素 theElement 
chainNode<T>* currentNode = headerNode->next; 
int index = 0; /当前 节点 的 索引 
while (currentNode->element != theElement) 
{ 
1/ 移动 到 下 一 个 节点 
currentNode = currentNode->next; 
index+t+，; 


// 确定 是 否 找 到 元 素 theElement 

if (currentNode == headerNode) 
return 二 二， 

else 
return index; 
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练习 


28. 使 用 大 小 分 别 为 100、1000、10 000 和 100 000 的 线性 表 ， 比 较 程 序 6-6 和 程序 6-13 的 
indexOf 方法 在 最 坏 和 平均 情况 下 的 运行 时 间 性 能 。 用 图 和 表 显 示 时 间 性 能 。 

29. 设计 类 circularList， 其 对 象 是 循环 链表 ， 如 图 6-6 所 示 ， 但 没有 头 节点 。 必 须 实 现 类 

chain ( 6.1.3 节 ) 和 extendedChain ( 6.1.5 节 ) 的 所 有 方法 。 计 算 每 一 个 方法 的 时 间 复 杂 度 。 

测试 你 的 代码 。 

. 使 用 循环 链表 做 练习 15。 

. 使 用 循环 链表 做 练习 16。 

. 使 用 循环 链表 做 练习 17。 

. 使 用 循环 链表 做 练习 19。 

. 使 用 循环 链表 做 练习 20。 

. 使 用 循环 链表 做 练习 21。 

. 使 用 循环 链表 做 练习 22。 

. 令 x 指 向 循环 链表 的 任意 一 个 节点 。 

1 ) 编写 一 个 方法 ， 删 除 节 点 x。 提 示 : 因为 不 知道 节点 x 的 前 驱 ， 所 以 删除 节点 x 有 困 
难 。 然 而 ， 可 以 用 后 继 y 的 数据 域 覆盖 x 的 数据 域 ， 然 后 删除 节点 y。 当 删除 最 后 一 
个 节点 之 后 ， 首 节点 成 为 最 后 的 节点 。 

2 ) 计算 方法 的 时 间 复 杂 度 。 

3 ) 使 用 自己 的 测试 数据 检验 方法 的 正确 性 。 

38. 编写 extendedLinearList 的 剩余 方法 ， 以 完成 了 circularListWithHeader。 每 一 个 方法 的 时 
间 复 杂 度 是 多 少 ? 测试 你 的 代码 。 

39. 使 用 带头 节点 的 循环 链表 ， 做 练习 15 和 16。 

40. 使 用 带头 节点 的 循环 链表 ， 做 练习 17 和 18。 

41. 使 用 带头 节点 的 循环 链表 ， 做 练习 19 和 20。 

42. 使 用 带头 节点 的 循环 链表 ， 做 练习 21 和 22。 


6.3 双向 链表 


对 于 线性 表 的 大 多 数 应 用 来 说 ， 采 用 链表 和 /或 循环 链表 已 经 足够 了 。 然 而 ， 对 于 有 些 
应 用 ， 如 果 每 个 元 素 节点 既 有 一 个 指向 后 继 的 指针 ,又 有 一 个 指向 前 驱 的 指针 ， 就 会 更 方便 。 
双向 链表 ( doubly linked list ) 便 是 这 样 一 个 有 序 的 节点 序列 ， 其 中 每 个 节点 都 有 两 个 指针 : 
next 和 previous。next 指针 指向 右边 节点 〈 如 果 存 在 )，previous 指针 指向 左边 节点 ( 如果 存 
在 )。 图 6-7 给 出 了 线性 表 (1,2,3,4) 的 双向 链表 描述 。 
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firstNode lastNode 
图 6-7 双向 链表 


定义 一 个 双向 链表 类 doublyLinkedList， 它 用 两 个 数据 成 员 firstNode 和 1lastNode， 分 
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别 指向 链表 最 左边 的 节点 和 最 右边 的 节点 ( 见 图 6-7 )。 当 双向 链表 只 有 一 个 元 素 节点 p 时， 
firstNode=lastNode=p。 当 双向 链表 为 空 时 ，firstNode=lastNode=NULL。 这 些 约定 与 扩展 链 
表 extendedChain 的 约定 相似 ( 见 程序 6-12 )。 如 果 在 双向 链表 中 查找 索引 为 index 的 元 素 ， 
那么 当 index<listSize/2 时 ， 就 从 左 至 右 查 找 ， 否 则 ， 就 从 右 至 左 查找 。 练 习 43 要 求 开 发 类 
doublyLinkedList。 

我 们 能 够 使 双向 链表 成 为 具有 头 节 点 的 循环 链表 。 在 一 个 非 空 的 双向 循环 链表 中 ， 
firstNode.previous 是 一 个 指向 最 右 端 节点 的 指针 ( 即 frstNode.previous=lastNode )，lastNode.next 
是 指向 最 左 端 节点 的 指针 。 我 们 可 以 省 略 变 量 frstNode 或 lastNode， 只 用 一 个 变量 来 跟踪 链表 。 





练习 


43. 设计 类 doublyLinkedList。 它 的 对 象 是 不 带头 节点 的 双向 链表 。 实 现 类 extendedChain 
(6.1.5 节 ) 的 所 有 方法 。 每 一 个 方法 的 时 间 复 杂 度 是 多 少 ? 测试 你 的 代码 。 

44. 编写 一 个 方法 ， 把 两 个 双向 链表 合并 为 一 个 双向 链表 。 在 合并 中 ， 把 第 二 个 链表 的 元 素 节 
点 附加 到 第 一 个 链表 的 尾部 。 合 并 之 后 ， 第 二 个 链表 应 该 为 空 。 测 试 你 的 代码 。 

45. 使 用 双向 链表 ， 做 练习 15 和 16。 

46. 使 用 双向 链表 ， 做 练习 17 和 18。 

47. 使 用 双向 链表 ， 做 练习 19 和 20。 

48. 使 用 双向 链表 ， 做 练习 21 和 22。 

49. 开发 类 doubleCircularList。 它 的 对 象 是 不 带头 节点 的 双向 链表 。 它 实现 类 extendedChain 
的 所 有 方法 ( 见 6.1.5 节 )。 每 一 个 方法 的 时 间 复 杂 度 是 多 少 ? 测试 你 的 代码 。 

50. 使 用 双向 循环 链表 ， 做 练习 15 和 16。 

51. 使 用 双向 循环 链表 ， 做 练习 44。 

52. 使 用 双向 循环 链表 ， 做 练习 17 和 18。 

53. 使 用 双向 循环 链表 ， 做 练习 19 和 20。 

54. 使 用 双向 循环 链表 ， 做 练习 21 和 22。 

55. 为 练习 49 的 双向 循环 链表 加 上 头 节点 。 然 后 和 一 个 等 价 的 类 比较 运行 时 间 。 这 个 等 价 类 
使 用 STL 容器 类 list， 就 像 vectorList ( 程序 5-12 ) 使 用 向 量 实现 数组 线性 表 一 样 。 进 行 
与 6.1.6 节 一 样 的 实验 。 

56. 使 用 带 有 头 节点 的 双向 循环 链表 ， 做 练习 15 和 16。 

57. 使 用 带 有 头 节点 的 双向 循环 链表 ， 做 练习 44。 

58. 使 用 带 有 头 节点 的 双向 循环 链表 ， 做 练习 17 和 18 

59. 使 用 带 有 头 节点 的 双向 循环 链表 ， 做 练习 19 和 20。 

60. 使 用 带 有 头 节点 的 双向 循环 链表 ， 做 练习 21 和 22。 

61. 为 练习 55 中 带 有 头 节 点 的 双向 循环 链表 设计 一 个 双向 迭代 器 。 使 用 适当 的 测试 数据 测试 
你 的 代码 。 


6.4 链表 用 到 的 词汇 表 


本 章 介绍 了 如 下 重要 概念 : 
@ 单 向 链表 (chain or singly linked list )。 令 x 是 一 个 单 向 链表 。 当 且 仅 当 xfirstNode=NULL 
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时 ，x 为 空 表 。 如 果 x 非 空 ， 则 xfirstNode 指向 链表 的 第 一 个 节点 ， 即 首 节 点 。 第 一 个 
节点 指向 第 二 个 节点 ， 第 二 个 节点 指向 第 三 个 节点 ， 以 此 类 推 。 最 后 一 个 节点 的 链 指针 
为 NULL。 

@ 单 向 循环 链表 (singly linked circular list )。 这 种 链表 与 单 向 链表 的 唯一 区 别 是 最 后 一 
个 节点 反 过 来 指向 第 一 个 节点 。 当 循环 链表 x 为 空 时 ，x.firstNode=NULL。 

@ 头 节点 ( header node )。 头 节点 是 链表 的 一 个 附加 节点 。 有 了 这 个 节点 ， 空 表 就 不 用 作 
为 特殊 情况 来 处 理 了 ， 程 序 因此 变 得 简单 。 有 了 头 节点 ， 每 个 链表 ( 包括 空 表 ) 都 至 
少 包括 一 个 节点 ( 即 头 节点 )。 

@ 双向 链表 〈 doubly linked list )。 双 癌 链 表 的 节点 从 左 至 右 按 序 排列 。 节 点 的 指针 域 next 
把 节点 从 左 至 右 链 接 在 一 起 。 在 最 右边 的 节点 中 ，next 指针 为 NULL。 节 点 的 另 一 个 指 
针 域 previous 把 节点 从 右 至 左 链接 在 一 起 。 在 最 左边 节点 中 ，previous 指针 为 NULL。 

@ 双向 循环 链表 (circular doubly linked list )。 这 种 链表 与 双向 链表 的 唯一 区 别 在 于 ， 最 
左边 节点 的 previous 指针 指向 最 右边 的 节点 ， 而 最 右边 节点 的 next 指针 指向 最 左边 的 


节点 。 
6.5 应 用 
6.5.1 箱子 排序 


假定 用 一 个 链表 保存 一 个 班级 学 生 的 清单 。 节 点 的 数据 域 有 : 学 生 姓 名 、 社 会 保险 号 码 、 
每 次 作业 和 考试 的 分 数 、 所 有 作业 和 考试 的 加 权 总 分 。 假 设 分 数 是 0 ~ 100 的 整数 。 我 们 要 
按 总 分 排序 。 如 果 采 用 第 2 章 的 任 一 种 排序 算法 ， 所 需 时 间 都 为 O(w*)， 其 中 为 学 生 总 数 。 
一 种 更 快 的 排序 方法 是 箱子 排序 (bin sort )。 这 种 排序 首先 把 分 数 相同 的 节点 放 在 同一 个 箱子 
里 ， 然 后 把 箱子 链接 起 来 就 得 到 有 序 的 链表 。 

图 6-8a 是 一 个 箱子 排序 的 例子 ， 链 表 有 10 个 节点 ， 每 个 节点 仅 显示 姓名 和 分 数 。 为 简 
便 起 见 ， 我们 假设 姓名 仅 为 一 个 字符 ， 分 数 介 于 0 ~ 5 之 间 。 

我 们 需要 6 个 箱子 ， 每 个 箱子 对 应 一 个 分 数 。 图 6-8b 是 10 个 节点 按 分 数 在 箱子 里 的 布 
局 。 沿 输入 链表 的 指针 逐个 检查 每 个 节点 ， 把 检查 到 的 节点 放 人 与 它 存 储 的 分 数 相 对 应 的 那 
个 箱子 。 第 一 个 节点 放 和 2 号 箱子 ， 第 二 个 节点 放 人 4 号 箱子 ， 以 此 类 推 。 然 后 从 0 号 箱子 
开始 收集 节点 ， 得 到 如 图 6-8c 所 示 的 有 序 链 表 。 

每 一 个 箱子 都 是 一 个 链表 。 一 个 箱子 的 节点 数目 介 于 0 ~ na 之 间 。 开 始 时 ， 所 有 箱子 都 
是 空 的。 

箱子 排序 需要 做 的 是 : 1 ) 逐个 删除 输入 链表 的 节点 ， 把 删除 的 节点 分 配 到 相应 的 箱子 
里 ; 2 ) 把 每 一 个 箱子 中 的 链表 收集 并 链接 起 来 ， 使 其 成 为 一 个 有 序 链 表 。 如 果 输 入 链表 是 程 
序 6-2 所 示 的 chain 类 型 ， 那 么 我 们 能 够 做 的 是 : 1 ) 连续 删除 链表 的 首 元 素 ， 并 将 其 插入 相 
应 的 某 个 箱子 的 链表 首位 ; 2 ) 从 最 后 一 个 箱子 开始 ， 逐 个 删除 每 个 箱子 的 元 素 ， 并 将 其 插 人 
一 个 初始 为 空 的 链表 的 首位 。 

程序 6-14 是 为 学 生 记 录 而 定义 的 一 个 结构 studentRecord， 使 用 的 链表 类 型 是 
chain<studentRecord>。 结 构 studentRecord 省 却 了 一 些 在 实际 应 用 中 应 有 的 数据 成 员 。 重 载 的 
操作 符 != 和 << 是 为 了 在 链表 chain 中 使 用 。 
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图 6-8 ”箱子 排序 的 例子 


程序 6-14 用 于 箱子 排序 的 链表 元 素 结构 


struct studentRecord 
{ 
int score; 
string* name; 
int operator !={const studentRecord& x) const 
{return (Score != x.Score);} 


上 多 


ostream& operator<<(ostream& out, const studentRecord& x) 
{out << x.score << ' ' << *x.name << endl; return out;} 


在 程序 6-14 定义 的 结构 studentRecord 中 ， 重 载 了 操作 符 !=， 它 把 studentRecord 类 型 转 
换 为 数值 类 型 ， 以 实现 比较 操作 和 其 他 目的 。 而 程序 6-15 给 出 了 结构 studentRecord 的 男 一 个 
定义 ， 它 重 载 了 类 型 转换 操作 符 int()。 这 样 一 来 ,诸如 +、/、<= 和 != 这 些 算术 和 关系 操作 符 ， 
虽然 没有 在 结构 studentRecord 中 明确 定义 , 但 是 首先 借助 类 型 转换 操作 符 intO 转换 成 int 类 
型 ， 就 可 以 完成 这 些 操作 。 在 某 种 程度 上 ， 这 个 方法 比 程 序 6-14 的 方法 更 具 普遍 性 ， 因 为 即 
使 链表 chain 的 方法 对 其 元 素 this->element 实施 其 他 操作 ， 都 不 会 出 现 问题 。 

我 们 可 以 把 上 述 两 种 重 载 的 方法 合并 ， 如 程序 6-16 所 示 。 这 样 一 来 ， 重 载 的 类 型 转换 操 
作 符 int( 只 有 在 操作 符 != 和 << 以 外 操作 中 被 调用 。 


程序 6-15 ”结构 studentRecord 的 另 一 种 定义 


struct studentRecord 
{ 
int score’; 
string* name; 


Operator int() const {return score;} 
1// 从 studentRecord 到 int 的 类 型 转换 
}; 


Ostreamg&g operator<<(ostreamg& out, const studentRecordg& x) 
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tout << x.score << ' ' << *x.name << endl; return out;} 


程序 6-16 ”结构 studentRecord 的 第 三 种 定义 


struct studentRecord 
{ 
int score; 
string* name; 


int operator !=(const studentRecord& x) const 
{return (Score != x.score);]} 
operator int() const {return score;} 


}; 


Oostream& operator<<(ostream& out, const studentRecord& x) 
{out << x.score << ' ' << *x.name << endl; return out;} 


程序 6-17 是 箱子 排序 方法 ， 甚 中 一 个 箱子 用 一 个 链表 。 虽 然 可 以 用 数组 来 表示 箱子 ， 但 
是 我 们 使 用 了 链表 ， 这 是 因为 我 们 还 要 开发 另 一 种 箱子 排序 方法 ， 而 它 是 链表 的 成 员 函 数 。 
在 这 个 算法 中 ， 使 用 链表 比 使 用 数组 更 有 效率 ， 因 为 输入 表 和 输出 表 都 是 链表 。 


程序 6-17 使 用 链表 的 多 个 方法 进行 箱子 排序 


void binSort (chain<studentRecord>& theChain, int range) 


{// 按 分 数 排序 


1// 对 箱子 初始 化 
chain<studentRecord> *bin; 
bin = new chain<studentRecord> [range + 1]; 


1// 把 学 生 记录 从 链表 取出 ， 然 后 分 配 到 精子 里 
int numberOfElements = theChain.size(); 
for (int i = 1; i <= numberOfElements; i++) 
{ 
studentRecord x = theChain.get (0); 
theChain.erase {0); 
bin[x.score] .insert (0,x); 
} 


// 从 箱子 中 收集 元 素 
for (int j = range; j >= 0; j--) 
while (!bin[j] .empty{()) 
{ 
studentRecord x = bin[j] .get (0); 
bin[j] .erase (0); 
theChain.insert (0,x); 
} 


delete [] bin; 





现在 分 析 时 间 性 能 。 首 先 注意 ,程序 6-17 可 能 因为 异常 而 提早 终止 。 例 如 ， 语句 


bin=new chain<studentRecord> [range+1]; 
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因 内 存 不 足 而 失败 。 这 时 ， 整 个 方法 的 时 间 复 杂 度 是 @(1)。 假 设 在 程序 运行 过 程 中 没有 异常 。 
第 一 个 for 循环 (执行 操作 符 new ) 需要 用 时 68(1)。 在 两 个 for 循环 中 ， 每 一 个 get、insert 和 
erase 操作 所 需 时 间 都 是 8(1)。 因 此 ， 第 一 个 for 循环 的 时 间 复 杂 度 是 9(n)， 其 中 是 输入 链 
表 的 大 小 ， 第 二 个 for 循环 的 时 间 复 杂 度 是 @(ntrange)， 如 果 不 考 虑 异常 ， 那 么 总 的 时 间 复 杂 
度 是 @(n+trange)。 

箱子 排序 binSort 作为 链表 chain 的 成 员 函 数 

如 果 你 在 乎 效率 ， 你 很 可 能 已 经 注意 到 ， 如 果 把 程序 6-17 的 箱子 排序 函数 binSort 定义 
为 链表 chain 的 一 个 成 员 果 数 ， 就 可 以 省 略 很 多 操作 : 每 次 insert 函数 的 调用 所 包含 的 new 操 
作 符 的 调用 ， 每 次 erase 函数 的 调用 所 包含 的 delete 操作 符 的 调用 。 不 仅 如 此 ， 通 过 跟踪 每 一 
个 箱子 的 首尾 节点 ， 就 可 以 在 “ 子 收集 阶段 ”把 箱子 链接 起 来 ， 如 程序 6-18 所 示 。 


程序 6-18 ”箱子 排序 作为 链表 chain 的 一 个 成 员 方 法 


template<class T> 

void chain<T>::binSort (int range) 

{V 对 链表 中 的 节点 排序 
1/ 创建 并 初始 化 箱子 
chainNode<T> **bottom, **top; 
bottom = new chainNode<T>* [range + 1]; 
top = new chainNode<T>* [range + 1]; 
for (int b= 07 b <= range; bt+) 

bottom[b] = NULL; 


/ 把 链表 的 节点 分 配 到 箱子 
for (; firstNode != NULL; firstNode = firstNode->next) 
{1/ 把 首 节点 firstNode 加 到 头子 中 
int theBin = firstNode->element; // 元 素 类 型 转换 到 整 型 int 


if (bottom[theBin] == NULL) 1/ 箱子 为 空 
bottom[theBin] = top[theBin] = firstNode; 

else 

{V 箱子 不 空 
top[theBin] ->next = firstNode; 
top[theBin] = firstNode; 


} 
} 


/把 箱子 中 的 节点 收集 到 有 序 链表 
chainNode<T> *y = NULL; 
for (int theBin = 0; theBin <= range; theBin++) 


if (bottom[theBin] != NULL) 
{V 箱子 不 空 
if (y == NULL) /第 一 个 非 空 箱子 
firstNode = bottom[theBinj]: 
else /不 是 第 一 个 非 空 箱子 


y->next = bottom[theBin]; 
y = topltheBin]; 
| 
if (y != NULL) 
y->next = NULL; 


delete [] bottom; 
delete [] top; 


OOOO 
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每 个 箱子 都 以 底部 节点 作为 首 节点 ， 项 部 节点 作为 尾 节点 。 每 个 箱子 都 有 两 个 指 
针 ， 分别 存储 在 数组 bottom 和 top 中 ， 分 别 指向 尾 节 点 和 头 节点 。bottom[theBin] 指向 箱 
子 theBin 的 尾 节 点 ， 而 top[theBin] 指向 箱子 theBin 的 首 节点 。 所 有 箱子 开始 为 空 表 ， 这 时 
bottom[theBin]=NULL。 程序 6-18 的 第 二 个 for 循环 把 输入 链表 的 节点 逐个 插入 相应 的 箱子 顶 
部 。 第 三 个 for 循环 从 第 0 个 箱子 开始 ， 把 非 空 的 箱子 依次 链接 起 来 ， 形 成 一 个 有 序 链表 。 

现在 分 析 时 间 性 能 ， 假 定 没有 异常 。 创 建 和 初始 化 数组 bottom 和 top， 与 第 三 个 for 循 
环 一 样 ， 所 需 时 间 为 9(range)， 第 二 个 for 循环 所 需 时 间 为 6(n)， 因 此 总 的 时 间 复 杂 度 为 
O(ntrange), 

注意 ,程序 6-18 的 箱子 排序 函数 不 会 改变 分 数 相 同 的 节点 的 相对 次 序 。 例 如 ， 在 输入 链 
中 , E、G 和 HH 的 分 数 均 为 3, E 在 G 前 , G 在 互 前 , 那么 ,在 排序 后 的 链表 中 , E 仍 在 G 前 ， 
G 仍然 在 旦 前 。 如 果 一 个 排序 方法 能 够 保持 同 值 元 素 之 间 的 相对 次 序 ， 则 该 方法 称 为 稳定 排 
序 (stable sort )。 


6.5.2 ”基数 排序 


对 6.5.1 节 的 箱子 排序 方法 可 以 扩展 ， 使 其 仅 在 8@(n) 时 间 内 ， 就 可 以 对 0 ~ nl 之 间 的 7 
个 整数 进行 排序 ， 其 中 c = 0 是 一 个 整数 常量 。 如 果 用 原来 的 binSort 方法 对 range=n" 来 排序 ， 
则 复杂 度 为 @Un+range)=G@(p9])。 扩 展 后 的 方法 与 binSort 不 同 ， 它 不 直接 对 数 进行 排序 ， 而 是 把 
数 (number ) 按照 某 种 基数 (radix ) 分 解 为 数字 ( digit )， 然 后 对 数字 排序 。 例 如 ， 用 基数 10 
把 十 进 制 数 928 分 解 为 数字 9.2 和 8( 即 928=9*10?+2*101+8*10" )， 把 3725 分 解 为 3.7.2 和 5， 
用 基数 60 把 3725 分 解 为 1、2 和 5( 即 (3725)io=(125)eo )。 这 便 是 基数 排序 (radix sort )。 

例 6-1 假定 对 0 ~ 999 之 间 的 10 个 整数 进行 排序 。 如 果 使 用 range=1000 的 箱子 排序 方 
法 ,那么 箱子 链表 的 初始 化 需要 1000 个 执行 步 ， 节 点 分 配 需要 10 个 执行 步 ， 从 箱子 中 收集 
节点 需要 1000 个 执行 步 ， 总 的 执行 步 数 为 2010。 而 基数 排序 方法 是 : 

1 ) 利用 箱子 排序 方法 ， 根 据 最 低位 数字 ( 即 个 位 数字 )， 对 10 个 数 进行 排序 。 因 为 每 个 
数字 都 在 0 ~ 9 之 间 ， 所 以 range=10。 图 6-9a 是 10 个 数 的 输入 链表 ， 图 6-9b 是 按 最 低位 数 
字 排 序 后 的 链表 。 








216|-={521}->1425|->{116|->| 91 -=[515}-={124} =| 34 -> 96 | = 24 | 


a) 输入 链表 
[521|-=| 91 |-=1124|-=| 34|=| 24|=425|-=[515|-=|216|-=[116|-=| 96 
b) 按 最 后 一 位 数字 排序 后 的 链表 

515|-=|216|-=|116|-=|521|-=|124|-=| 24 |=|425|-=| 34 上 >| 91 -> 96 | 
c) 按 倒数 第 二 位 数字 排序 后 的 链表 


24|= 34 上-> | 91 二 >| 96 |=[16|-=[124|-=|216|-=[425|-=|515|-=|52 
d) 按 最 高 位 数字 排序 后 的 链表 


图 6-9 用 x=10 和 d=3 进行 基数 排序 


2) 利用 箱子 排序 方法 ， 对 1 ) 的 结果 按 次 低位 数字 ( 即 十 位 数字 ) 进行 排序 。 同 样 有 
range=10。 因为 箱子 排序 是 稳定 排序 ， 所 以 次 低位 数字 相同 的 节点 ， 按 最 低位 数字 排序 所 得 
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到 的 次 序 保 持 不 变 。 因 此 ， 现 在 的 链表 是 按照 最 后 两 位 数字 进行 排序 的 。 图 6-9c 是 相应 的 排 
序 结果 。 

3 ) 利用 箱子 排序 方法 ， 对 2 ) 的 结果 按 第 三 位 数字 ( 即 百 位 数字 ) 进行 排序 。 小 于 100 
的 数 ， 第 三 位 数字 为 0。 因为 按 第 三 位 数字 排序 是 稳定 排序 , 所 以 第 三 位 数字 相同 的 节点 ， 
i a 因此 ， 现 在 的 链表 是 按照 后 三 位 数字 进行 排序 
的 。 图 6-9d 是 相应 的 排序 结 

We 10 为 基数 ， 把 数 分 解 为 十 进 制 数字 进行 排序 。 因 为 每 个 数 至 少 有 
三 位 数字 ， 所 以 要 进行 三 次 排序 ， 每 次 排序 都 使 用 range=10 个 箱子 排序 。 每 次 箱子 的 初始 化 
需要 10 个 执行 步 ， 节 点 分 配 需要 10 个 执行 步 ， 从 箱子 中 收集 节点 需要 10 个 执行 步 ， 总 的 执 
行 步 数 为 90， 比 使 用 range=1000 的 箱子 排序 要 少 得 多 。 单 个 箱子 排序 ( 一 数 一 个 箱子 的 ) 实 
际 上 等 价 于 r=1000 的 基数 排序 。 加 

例 6-2 假定 对 0 ~ 10%~1 的 1000 个 整数 进行 排序 ， 使 用 基数 r=10" 的 排序 方法 相当 于 
直接 对 数 使 用 箱子 排序 。 对 箱子 初始 化 需要 10 个 执行 步 ， 节 点 分 配 需 要 1000 个 执行 步 ， 收 
集 箱子 节点 需要 10 个 执行 步 ， 总 的 执行 步 数 为 2 001 000。 而 使 用 基数 r=1000 的 排序 方法 ， 
其 过 程 如 下 : 

1 ) 采用 每 个 数 的 最 低 三 位 数字 进行 排序 ， 令 range=1000。 

2 ) 对 1 ) 的 结果 按 倒 数 次 三 位 ( 即 倒数 第 四 到 六 位 ) 数字 进行 排序 。 

上 述 每 次 排序 都 需要 3000 个 执行 步 ， 因 此 总 共 需 要 6000 个 执行 步 。 若 使 用 基数 为 
x=100 的 排序 方法 ， 则 需要 三 次 箱子 排序 ， 每 次 针对 两 位 数字 。 每 次 箱子 排序 需要 1200 个 执 
行 步 ， 总 的 执行 步 数 为 3600。 如 果 使 用 基数 为 二 10 的 排序 方法 ， 则 要 进行 6 次 箱子 排序 ， 
每 次 针对 一 位 数字 ， 总 的 执行 步 数 为 6(10+1000+10)=6120。 对 于 本 例 ， 基 数 x=100 的 排序 效 
率 最 高 。 轩 

把 数 分 解 为 数字 需要 除法 和 取 模 操作 。 如 果 用 基数 10 来 分 解 , 那么 从 最 低位 到 最 高 位 的 
数字 分 解 式 为 : 

x%10; (x%100)/10; (x%1000)/100; ... 

若 r=100， 则 相应 的 数字 分 解 式 为 : 

x%100; (x%10000)/100; (x%1000000)/10000; 

对 于 一 般 的 基数 +， 相 应 的 分 解 式 为 : 

Xx%r; (XW%PNr; (Kh; ... 

当 使 用 基数 r=n 对 0 ~ 天 -1 范围 内 的 个 整数 进行 分 解 时 ， 每 个 数 可 以 分 解 出 c 个 数字 。 
因此 ， 对 7 个 数 ， 可 以 用 c 次 range=n 个 箱子 排序 。 因 为 c 是 一 个 常量 ， 所 以 整个 排序 时 间 为 
O(cn)=O(n), 


6.5.3” 凸 包 


至 少 有 三 条 直线 边 的 平面 封闭 图 形 称 为 多 边 形 (polygon )。 图 6-10a 的 多 边 形 有 6 条 边 ， 
图 6-10b 的 多 边 形 有 8 条 边 。 多 边 形 既 包含 其 边线 上 的 点 ， 也 包含 边线 内 的 点 。 一 个 多 边 形 ， 
如 果 它 的 任意 两 个 点 的 连 线 都 不 包含 该 多 边 形 以 外 的 点 ， 就 称 为 凸 多 边 形 ( convex polygon )。 
图 6-10a 的 多 边 形 是 凸 多 边 形 ， 而 图 6-10b 的 多 边 形 不 是 凸 多 边 形 。 图 6-10b 的 两 条 虚线 段 虽 
然 其 端点 属于 多 边 形 ， 但 它们 都 包含 了 多 边 形 以 外 的 点 。 
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a) 凸 多 边 形 b) 非 凸 多 边 形 
图 6-10 巴 多 边 形 和 非 凸 多 边 形 


一 个 平面 点 集 $ 的 凸 包 (convex hull ) 是 指 包含 8 的 最 小 凸 多 边 形 。 该 多 边 形 的 顶点 
( 即 角 ) 称 为 S$ 的 极点 (extreme point )。 图 6-11 是 平面 上 的 13 ® 四 
个 点 ， 它 的 凸 包 是 由 实 线 连 成 的 多 边 形 ， 极 点 用 圆圈 来 标识 。 如 
果 5 的 点 都 落 在 一 条 直线 段 上 ( 即 这 些 点 是 共 线 点 )， 那么 5 的 
凸 包 就 退化 为 包含 $ 的 最 短 直线 。 四 
寻找 一 个 平面 点 集 的 西 包 是 计算 几何 (computational @ 
geometry ) 的 基本 问题 。 计 算 几 何 还 有 其 他 问题 (如 包含 一 个 指 
定点 集 的 最 小 短 形 )， 求 解 这 些 问题 需 要 计算 凸 包 。 此 外 ， 凸 包 
在 图 象 处 理 和 统计 学 中 也 有 应 用 。 。… 平 面 点 
假定 在 8 的 西 包 内 部 取 一 个 点 刀 然后 从 无 向 下 画 一 条 重 这 全 
直线 ( 如 图 6-12a 所 示 )。 练 习 67 说 明了 如 何 选择 点 所 这 条 图 11 平面 点 集 的 品 包 
垂直 线 与 式 和 3 的 第 ;个 点 的 连 线 之 间 有 一 个 闭 时 针 夹 角 ， 称 为 极 角 (polar )， 用 aj; 表示。 
图 6-12a 给 出 了 极 角 a;。 现 在 按照 极 角 非 递减 次 序 来 排列 5S 的 点 ， 对 于 极 角 相同 的 点 ， 按 照 
它们 与 了 的 距离 从 小 到 大 来 排列 。 在 图 6-12a 中 ， 所 有 点 按照 上 述 次 序 被 依次 编号 为 1 ~ 13。 


四 他 


12 1 
b) 道 时 针 夹 角 





图 6-12 标识 极点 


从 半 向 下 的 垂 线 沿 道 时 针 扫 描 ， 按 照 极 角 的 次 序 会 依次 遇 到 5 的 极点 。 如 果 w、v 和 w 
是 按照 逆 时 针 排 列 的 三 个 连续 的 极点 ， 那 么 从 w 到 v 与 从 w 到 vv 两 条 连 线 之 间 的 逆 时 针 夹 角 
大 于 180 度 。( 图 6-12b 给 出 了 点 8，11，12 之 间 的 逆 时 针 夹 角 。) 当 按 照 极 角 次 序 排列 的 3 
个 连续 点 之 间 的 逆 时 针 夹 角 小 于 或 等 于 180 度 时 ， 第 二 个 点 不 是 极点 。 当 wu、v、w 间 的 逆 时 
针 夹 角 小 于 180 度 时 ， 如 果 从 4 走 到 v 再 走 到 w， 那 么 在 v 点 将 会 向 右 转 。 当 按 逆 时针 方向 
在 一 个 凸 多 边 形 上 行走 时 ， 所 有 的 转弯 都 是 向 左 转 。 根 据 这 种 观察 ， 得 出 了 图 6-13 的 算法 ， 
用 以 寻找 5 的 极点 和 凸 包 。 
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步骤 1 ) [ 处 理 退化 情况 ] 
如 果 $ 的 点 少 于 3 个 ， 则 返回 S 
如 果 S 的 所 有 点 都 在 一 条 直线 上 ， 即 共 线 ， 则 计算 并 返回 包含 S 所 有 点 的 最 短 直线 的 两 个 端点 
步骤 2 ) [ 按 极 角 排 序 ] 
在 S$ 的 点 包 内 找到 一 个 点 义 
按照 极 角 递增 次 序 来 排列 S 的 点 ， 对 于 极 角 相 同 的 点 ， 按 照 它 们 与 X 的 距离 从 小 到 大 来 排列 
创建 一 个 以 S 的 点 为 元 素 ， 按 照 上 述 顺 序 排列 的 双向 循环 链表 
令 right 指向 后 继 ，left 指向 前 驱 
步骤 3 ) [ 删除 非 极点 的 点 ] 
令 p 是 y 坐 标 最 小 的 点 (也 可 以 是 x 坐标 最 大 的 ) 


for (x=P,Lx=X 右 边 的 下 一 个 点 ; p!=rx;) 
{ 


rrx= zx 右边 的 点 ; 
if (x, rx 和 rrx 的 北 时 针 夹 角 小 于 或 等 于 180 度 ) 


从 链表 中 删除 rx; 
rxX=X; X=rX 左边 的 点 ; 
} 


else{x=rx; rx=rrx;} 





图 6-13 寻找 5 的 凸 包 的 伪 码 


步骤 1) 处 理 退 化 情况 ， 即 $5 的 点 数 为 0 或 1, 或 5 的 所 有 点 是 共 线 的 。 这 一 步 用 时 
O(n)， 其 中 4 是 5 的 点 数 。 判 断 共 线 的 方法 是 ， 任 取 两 个 点 , 求 出 两 点 连 线 的 方程 式 ， 然 后 
检查 余下 的 n-2 个 点 是 否 在 这 条 直线 上 。 如 果 所 有 点 是 共 线 的 ， 也 可 以 确定 最 短 直线 的 端点 。 

步骤 2 ) 按照 极 角 的 次 序 排列 5 的 点 ， 并 把 它们 存 入 一 个 双向 链表 。 之 所 以 采用 双向 链 
表 是 因为 步骤 3 ) 需要 消除 非 极 点 的 点 ， 并 在 链表 中 反 向 移动 ( 练习 67 会 要 求 你 采用 一 个 单 
向 链表 )。 因 为 需要 排序 ， 所 以 如 果 采 用 第 2 章 的 排序 算法 ， 需 要 耗 时 OU 为 。 在 第 9 章 和 第 
14 章 中 ,可 以 在 O(nlogn) 时 间 内 完成 排序 ， 因 此 步骤 2) 的 时 间 复 杂 度 可 以 计 为 O(nlogn)。 

步骤 3 ) 依次 检查 按 逆 时 针 次 序 排列 的 三 个 连续 点 ， 如 果 它 们 的 逆 时 针 夹 角 小 于 或 等 于 
180 度 ， 则 中 间 的 点 rx 不 是 极点 ， 要 从 链表 中 删除 之 。 如 果 夹 角 超过 180 度 ， 则 rx 可 能 是 也 
可 能 不 是 极点 ,可 将 点 x 移 到 下 一 个 点 。 当 for 循环 终止 时 ， 在 链表 中 每 三 个 连续 的 点 所 形成 
的 递 时 针 夹 角 都 超过 180 度 ， 因 此 链表 的 点 都 是 极点 。 沿 着 链表 的 next 指针 域 移动 ， 就 是 按 
闭 时 针 方 向 遍历 凸 包 的 边界 。 从 ?坐标 最 小 的 点 开始 ， 是 因为 这 个 点 肯定 在 凸 包 上 。 

现在 分 析 步 又 3) 的 时 间 复 杂 度 。 在 for 循环 中 ， 每 次 检查 一 个 夹 角 之 后 ,或 者 顶点 rx 被 
删除 ，x 在 链表 中 后 移 一 个 位 置 ， 或 者 x 前 移 一 个 位 置 。 由 于 被 删除 的 顶点 数 为 O(n)，x 最 多 
向 后 移动 O(n) 个 位 置 。 因 此 第 二 种 情形 只 会 发 生 O(n) 次 ， 因 而 for 循环 将 执行 O(n) 次 。 因 
为 检查 一 个 夹 角 需 要 耗 时 B(1)， 所 以 步骤 3) 的 复杂 度 为 O(n)。 结 果 ， 为 了 找到 个 点 的 凸 
包 ， 需 要 耗 时 O(nlogn)。 


6.5.4 ”并 查 集 


1. 等 价 类 
假定 一 个 具有 nn 个 元 素 的 集合 U=1，2,，…, n 和 一 个 具有 + 个 关系 的 集合 R=(ii, 放 )， 
(jz 用)，…，(i,,Jn)。 关 系 怀 是 一 个 等 价 关系 ( equivalence relation )， 当 和 且 仅 当 如 下 条 件 为 真 : 
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e@ 对 于 所 有 的 a E U， 有 (a,a) E R 时 (关系 是 自 反 的 )。 

e (q,p) E R， 当 且 仅 当 (B,a) € R (关系 是 对 称 的 )。 

@ 若 (a,p) E R 且 (b,c) ER 则 有 (ac) E R (关系 是 传递 的 )。 

在 给 出 等 价 关系 时， 我 们 经 常会 忽略 其 中 的 某 些 数 对 ， 这 些 数 对 可 以 应 用 等 价 关 系 的 
自 反 性 、 对 称 性 和 传递 性 来 得 到 。 

例 6-3 假定 n=14, R={(1,11), (7,11), (2,12), (12,8), (11,12), (3,13), (4,13), (13,14), 
(14,9)，(5,14)，(6,10)}。 我 们 忽略 了 所 有 形 如 (aa) 的 数 对 ， 因 为 按照 自 反 性 ， 这 些 数 对 是 隐 
含 的 。 同 样 也 忽略 了 所 有 对 称 的 数 对 。 因 为 (1,11) E R， 所 以 按照 对 称 性 应 有 (11,1) E R。 其 
他 被 忽略 的 数 对 由 传递 性 可 以 得 到 。 例 如 ,由 (7,11) 和 (11,12)， 可 以 得 到 (7,12) E R。 男 

如 果 (a,b) ER， 则 元 素 a 和 几 是 等 价 的 。 所 谓 等 价 类 (equivalence class ) 是 指 相 互 等 价 
的 元 素 的 最 大 集合 。“ 最 大 ”意味 着 不 存在 类 以 外 的 元 素 与 类 内 部 的 元 素 等 价 。 因 为 一 个 元 素 
只 能 属于 一 个 等 价 类 ， 等 价 关 系 把 集合 U 划分 为 不 相交 的 等 价 类 。 

例 6-4 考察 例 6-3 中 的 等 价 关 系 。 由 于 元 素 1 与 11，11 与 12 是 等 价 的 ， 因此， 元 素 
1、11、12 是 等 价 的 ， 它 们 应 属于 同一 个 等 价 类 。 不 过 ， 这 三 个 元 素 还 不 能 构成 一 个 等 价 类 ， 
因为 还 有 其 他 的 元 素 与 它们 等 价 (例如 7)。 因 此 {1,11,12} 不 是 等 价 元 素 的 最 大 集合 。 集 合 
{1,2,7,8,11,12} 才 是 一 个 等 价 类 。 关 系 尺 还 定义 了 另外 两 个 等 价 类 : {3,4,5,9,13,14} 和 {6,10}。 
注意 ， 这 三 个 等 价 类 是 互 不 相交 的 。 国 

在 离线 等 价 类 ( offline equiralence class ) 问题 中 ,已 知 n 和 RR， 确定 所 有 的 等 价 类 。 由 
等 价 类 的 定义 得 知 ， 每 个 元 素 只 能 属于 一 个 等 价 类 。 在 在 线 等 价 类 ( online equiralence class ) 
问题 中 ,初始 时 有 n 个 元 素 ， 每 个 元 素 都 属于 一 个 独立 的 等 价 类 。 需 要 执行 以 下 的 操作 : 
1 ) combine(a,b)， 把 包含 a 和 5。 的 等 价 类 合并 成 一 个 等 价 类 。2 ) find(theElement)， 确定 元 素 
theElement 在 哪 一 个 类 ， 目 的 是 对 给 定 的 两 个 元 素 ， 确 定 是 否 属于 同一 个 类 。 它 对 同一 类 的 
元 素 ， 返 回 相 同 的 结果 ， 而 对 不 同类 的 元 素 ， 返 回 不 同 的 结果 。 

可 以 用 find 操作 和 unite( 或 union) 操作 产生 一 个 组 合 操作 ， 该 操作 能 把 两 个 不 同 的 类 合 
并 成 一 个 类 。 因 此 combine(a,b) 等 价 于 

classA=find (a)， 

classB=find (b); 


if (classA!=classB) 
unite(classA,classB); 


注意 ， 利 用 查找 与 合并 操作 ， 可 以 向 R 中 添加 新 关系 。 例 如 ， 为 了 添加 关系 (a,p)， 可 以 
首先 判断 a 和 4b 是 否 已 经 位 于 同一 个 等 价 类 ， 如 果 是 ， 则 新 关系 是 元 余 的 ， 如 果 不 是 ， 则 对 
包含 a 和 4 的 两 个 类 执行 unite 操作 。 

本 节 主 要 关心 在 线 等 价 类 问题 ， 这 类 问题 通常 又 称 为 并 查 集 ( union-find ) 问题 。 本 节 给 
出 的 解决 方案 很 简单 ， 但 是 效率 不 是 最 高 的 。11.9.2 节 给 出 了 一 个 更 快 的 解决 方案 。 离 线 等 价 
类 问题 的 快速 解决 方案 将 在 8.5.5 节 给 出 。 

2. 应 用 

下 面 有 两 个 在 线 等 价 类 问题 的 应 用 实例 : 机 器 调度 问题 和 布线 问题 。 布 线 问题 也 可 以 描 
述 为 离线 等 价 类 问题 。 

例 6-5 某 工 三 有 一 台 机 器 能 够 执行 n 个 任务 ,任务 i 的 开始 时 间 为 整数 x;， 截 止 时 间 为 
整数 d;。 在 该 机 器 上 完成 每 个 任务 都 需要 一 个 单元 的 时 间 。 一 种 可 行 的 调度 方案 是 为 每 个 任 
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务 分 配 相应 的 时 间 段 ， 使 得 分 配给 任务 i 的 时 间 段 正好 位 于 开始 时 间 和 截止 时 间 之 间 。 一 
时 间 段 不 允许 分 配给 多 个 任务 。 


考察 下 面 的 4 个 任务 : 

任务 4 B C D 
开始 时 间 0 0 1 2 
截止 时 间 4 4 有 3 


任务 4 和 任务 B 的 开始 时 间 均 为 0, 任务 C 的 开始 时 间 为 1， 任务 DD 的 开始 时 间 为 2。 
下 面 的 任务 的 时 间 调 度 方案 是 可 行 的 :在 0 ~ 1 期 间 执行 任务 4; 1 ~ 2 期 间 执行 任务 C; 2 ~ 3 
期 间 执行 任务 D; 3 ~ 4 期 间 执行 任务 B ( 见 图 6-14 )。 

设计 一 个 调度 的 直观 方法 如 下 : 

1 ) 按 开始 时 间 的 非 递 增 次 序 对 任务 进行 排序 

2 ) 按 开始 时 间 的 非 递 增 次 序 考 察 任 务 。 对 于 每 个 任务 ， 图 6-14 对 4 个 任务 的 一 个 调度 
确定 一 个 空闲 时 间 段 ， 这 个 时 间 段 在 截止 时 间 之 前 ， 但 与 截止 时 间 最 接近 。 如 果 这 个 空闲 时 
间 段 位 于 任务 的 开始 时 间 之 前 ， 则 分 配 失败 ， 和 否则 就 把 这 个 时 间 段 分 配给 该 任务 。 

练习 74 要 求 你 证 明 ， 如 果 不 存 在 一 个 可 行 的 调度 方案 ， 则 上 述 策略 失败 。 

在 线 等 价 类 问题 的 方法 可 用 来 实现 步骤 2)。 令 4 为 所 有 任务 中 最 后 的 截止 时 间 。 将 可 
用 时 间 段 表示 为 “从 i-1 至 i， 其 中 1 < i< 4。 把 这 些 时 间 段 称 为 时 间 段 1 至 时 间 段 4。 对 
于 任意 一 个 时 间 段 a， 用 near(a) 表示 空闲 时 间 段 i， 其 中 i 是 在 < a 范围 内 最 大 的 i。 如 果 这 
样 的 i 不 存在 ， 则 定义 near(a)=near(0)=0。 两 个 时 间 段 a 和 4b 属于 同一 个 等 价 类 ， 当 目 仅 当 
near(a)=near(b)。 

在 任务 调度 之 前 ， 对 于 所 有 时 间 段 都 有 near(a)=a， 且 每 个 时 间 段 都 是 一 个 独立 的 等 
价 类 。 当 按 步 又 2) 把 时 间 段 a 分 配给 某 个 任务 时 ， 对 于 原来 所 有 near(bp)=a 的 时 间 段 b， 
near(b) 的 值 都 发 生 了 变化 。 对 于 这 些 时 间 段 ， 其 新 的 near 值 为 near(a-1)。 因 此 ， 当 把 时 间 段 
a 分 配给 一 个 任务 时 ， 需 要 对 当前 包含 时 间 段 a 和 a-1 的 等 价 类 进行 合并 。 如 果 每 个 等 价 类 e 
用 nearest[e] 表示 其 成 员 的 near 值 ， 那 么 near(a) 将 由 nearest[find(a)] 给 出 。( 假设 等 价 类 名 是 
find 操作 返回 值 。) 时 

例 6-6[ 布 线 ] 一 个 电路 由 构件 、 管 脚 和 电线 构成 。 图 6-15 是 一 个 由 三 个 构件 A、B 和 
C 构成 的 电路 。 每 根 电线 连接 一 对 管 脚 。 两 个 管 脚 a 和 b 是 电子 等 价 ( electrically equivalent ) 
的 ， 当 和 且 仅 当 有 一 根 电线 直接 连接 a 和 4b,， 或 者 存在 一 个 管 脚 序列 i ，i,，…，ii， 使 得 在 管 
脚 对 序列 a, ;ih 记 ; 如 ;… ;ip1，it 和 i，b 中 ， 每 一 对 管 脚 均 有 电线 直接 连接 。 一 
网 络 net 是 指 由 电子 等 价 的 管 脚 所 构成 的 最 大 集合 。“ 最 大 ”是 指 不 存在 网 络 外 的 管 脚 与 网 络 


内 的 管 脚 电子 等 价 。 
管 脚 




















电线 
图 6-15 一 个 印 制 电路 板 上 的 3 芯片 电路 
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考察 图 6-16 所 示 的 电路 。 在 该 图 中 仅 画 出 了 管 脚 和 电线 。14 个 管 脚 从 1 ~ 14 编号 。 每 
根 电 线 可 由 它 所 连接 的 两 个 管 脚 来 描述 。 例 如 ， 连 接管 脚 1 和 11 的 电线 可 以 表示 为 (1,11)， 
它 与 (11,1) 等 价 。 电 线 的 集合 为 {(1,11), (7,11)，(2,12), (12,8),，(11,12)，(3,13)，(4,13)， 
(13,14)，(14,9)，(5,14)，(6,10)}。 因 此 ， 在 该 电路 中 的 网 络 有 : {1，2，7，8，11，12}， 











13,. 4 3 9, 3 14} 和 人，10j 1 2 3 4 5 6 
在 离线 网 络 搜 索 问 题 (offline net ] | 

finding problem ) 中 ,已 知 管 脚 和 电线 ， | 可 

需要 确定 相应 的 网 络 。 如 果 把 每 个 管 脚 1 < 3 

看 成 U 的 一 个 成 员 ， 把 每 根 电线 看 成 R | 

的 成 员 ， 那 么 离线 网 络 搜索 问题 就 可 以 3 ; 和 

edi 图 6-16 仅 有 管 脚 和 电线 的 电路 


对 于 在 线 网 络 搜 索 问 题 (online 
net finding problem )， 起 始 时 有 一 组 管 脚 的 集合 ， 没 有 电线 ， 然 后 要 执行 以 下 操作 : 1 ) 增加 
一 根 连 接 a 和 4b 的 电线 ; 2 ) 搜索 包含 管 脚 g 的 网 络 。 搜 索 的 目的 是 确定 两 个 管 脚 是 否 属于 
同一 个 网 络 。 在 线 网 络 搜索 问题 实际 上 等 同 于 在 线 等 价 类 问题 。 初 始 时 没有 电线 ， 相 当 于 
R= 加， 网 络 搜索 操作 对 应 于 等 价 类 的 fnd 操作 ， 添 加 电线 (a,b) 对 应 于 combine(a,b)， 它 与 
unite(find(a),find(b)) 等 价 。 加 

3. 第 一 种 并 查 集 解 决 方案 

对 在 线 等 价 类 问题 ， 有 一 种 简单 的 解决 办 法 。 使 用 一 个 数组 equivClass， 且 令 equivClass 
中 为 包含 元 素 i 的 等 价 类 。 初 始 化 、 合 并 及 搜索 的 方法 如 程序 6-19 所 示 。n 是 元 素 个 数 。n 
和 equivClass 均 为 全 局 变量 。 为 了 合并 两 个 不 同 的 类 ， 我 们 从 两 者 中 任 取 一 个 类 ， 然 后 把 
该 类 所 有 元 素 的 值 修改 成 男 一 个 类 元 素 的 值 。 注 意 ， 函 数 unite 的 输入 是 equivClass 值 ( 即 
find 函数 的 结果 )， 而 不 是 元 素 的 索引 。 在 函数 unite 中 ,我 们 假设 参与 合并 的 两 个 类 是 不 同 
的 ， 尽 管 两 个 类 相同 时 ， 函 数 也 是 正确 的 。 函 数 initialize 和 unite 的 复杂 度 均 为 9(n) (假定 
在 initialize 中 实施 new 操作 时 不 产生 异常 )， 函 数 fnd 的 复杂 度 为 6(1)。 从 例 6-5 和 例 6-6 
可 知 ， 在 应 用 这 些 函 数 时 ， 通 常 执行 一 次 初始 化 、2 次 合并 和 j 次 查找 ， 故 所 需要 的 总 时 间 为 
O(n+u*ntf)=O(u*nt+f)。 


程序 6-19 ”使 用 数组 实现 的 并 查 集 算法 


int *equivClass, 1/ 等 价 类 数组 
n; 1/ 元素 个 数 


void initialize(int numberOfEl]ements) 
{// 用 每 个 类 的 一 个 元 素 ， 初 始 化 numberOfElements 个 类 
n= numberOfElements; 


equivClass = new int [n+ 1]:; 
for (int & = 1l; e <= Nn; e++) 
equivClass[le] = e; 


} 


void unite (int classA, int classB) 
{/W 合并 类 classA 和 classB 
1/ 假 设 类 classA != classB 
for (int k = 1; k <= n; k++) 
if (equivClass[k] == classB) 
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equivClass[k] = classaAa; 
} 


int find (int theElement) 
{1/ 查找 具有 元 素 theElement 的 类 
return equivClass[theElement]; 


} 


4. 第 二 种 并 查 集 解决 方案 
如 果 一 个 等 价 类 对 应 一 个 链表 ， 那 么 合并 操作 的 时 间 复 杂 度 就 可 以 降低 ， 因 为 在 一 个 等 
价 类 中 ， 可 以 沿 着 链表 的 指针 找到 所 有 的 元 素 ， 而 不 必 去 检查 所 有 的 equivClass 的 值 。 事 实 
上 ， 如 果 知 道 每 一 个 等 价 类 的 大 小 ,我 们 可 以 选择 较 小 的 类 来 改变 equivClass 的 值 ， 从 而 加 
快 合并 速度 。 通 过 使 用 整 型 指针 ( 也 称 模 拟 的 指针 )， 可 以 快速 访问 元 素 e 的 节点 。 我 们 采用 
以 下 约定 : 
e equivNode 是 一 个 结构 ， 具 有 数据 成 员 equivClass、size 和 next。 程 序 6-20 是 这 个 结 
构 的 代码 。 
e 类 型 为 equivNode 的 数组 node[1:n] 用 于 描述 n 个 元 素 ， 每 个 元 素 都 有 一 个 对 应 的 等 价 
类 链表 。 
e node[e].equivClass 既是 函数 find(e) 的 返回 值 ， 也 是 一 个 整 型 指针 ， 该 指针 指向 等 价 类 
node[e]. equivClass 的 链表 的 首 节点 。 
e 只 有 e 是 链表 的 首 节 点 ， 才 定义 node[el.size， 这 时 ，node[e].size 表示 从 node[e] 开始 
的 链表 的 节点 个 数 。 
e node[e].next 给 出 了 包含 节点 e 的 链表 的 下 一 个 节点 。 因 为 节点 从 1 至 n 编号 ， 所 以 可 
以 用 0 来 表示 空 指针 NULL。 


程序 6-20 ”结构 equivNode 


struct equivNode 


int equivClass, / 元素 类 标识 符 
size, 1/ 类 的 元 素 个 数 
next; /类 中 指向 下 一 个 元 素 的 指针 





程序 6-21 给 出 了 initialize 、unite 和 find 的 新 代码 。 


程序 6-21 ”使 用 链表 和 整 型 指针 实现 的 并 查 集 算法 


equivNode *node; 1// 节点 的 数组 
int ns // 元素 个 数 


void initialize(int numberOfElements) 
{// 用 每 个 类 的 一 个 元 素 ， 初 始 化 numberOfElements 个 类 
n = numberOofElements; 


node = new equivNode [n+ 1]; 
for (int e = 17 e <= n; e++) 
{ 

nodele] .equivClass = e; 


node[e] .next = 0; /1/ 链表 中 没有 下 一 个 节点 
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nodele] .size = 1; 


void unitel(int classA, int classB) 
{W 合并 类 classA 和 classB 

1/ 假 设 classA != classB 

1/classA 和 classB 是 链表 首 元 素 


1// 使 classA 成 为 较 小 的 类 
if (node[classA] .size > node[classB] .size) 
swap (classA, classB); 


1/ 改变 较 小 类 的 equivClass 值 


int Ks 
for (k = classA; node[k] .next != 0; k = node[k] .next) 
node[k] .equivClass = classB; 


node[k] .equivClass = classB; // 链 表 的 最 后 一 个 节点 


// 在 链表 classB 的 首 元 素 之 后 插入 链表 classA 

/ 修改 新 链表 的 大 小 

node[classB] .size += node[classaA]l .size; 
node[k] .next = node[classB] .next; 
node[classB] .next = classAa; 


} 


int find (int theElement) 
{// 查找 包含 元 素 theElement 的 类 
return node[ltheElement] .equivClass; 


} 


在 使 用 链表 时 ， 因 为 一 个 等 价 类 的 大 小 为 O(n)， 所 以 合并 操作 的 复杂 度 为 O(n)。 而 初始 
化 和 查找 操作 的 复杂 度 仍 分 别 保持 为 O(n) 和 8@(1)。 为 了 确定 1 次 初始 化 操作 、w 次 合并 操作 
和 f 次 查找 操作 所 需要 的 时 间 复 杂 度 ， 需 要 使 用 如 下 的 定理 。 

引 理 6-1 如 果 开 始 时 有 nn 个 类 ， 每 个 类 有 一 个 元 素 ， 则 在 执行 u 次 合并 操作 以 后 ， 

a ) 任何 一 个 类 的 元 素数 都 不 会 超过 x+1。 

b ) 至 少 存 在 mn-2u 个 单元 素 类 。 

C ) u<n, 

证 明 见 练习 72。 辐 

1 次 初始 化 和 J 次 查找 的 复杂 度 为 O(nt+/)。 对 于 4 次 合并 ， 每 一 次 合并 的 性 能 为 @( 较 小 
类 的 大 小 )。 在 合并 中 ， 小 类 的 元 素 被 移 到 大 类 。 一 次 合并 的 复杂 度 为 O( 移动 的 元 素 个 数 )， 
u 次 合并 的 复杂 度 为 O( 总 的 移动 元 素 的 个 数 )。 一 次 合并 之 后 ， 新 类 的 大 小 至 少 是 原来 小 类 
大 小 的 两 倍 。 因 此 ， 由 于 在 操作 结束 时 没有 哪个 类 的 元 素数 会 超过 x+1l ( 引 理 6-1a )， 所 以 在 
u 次 合并 中 ， 没 有 哪个 元 素 的 移动 次 数 超过 logx(xw+l)。 另 外 ， 根 据 引 理 6-1b， 最 多 有 2z 个 元 
素 移 动 。 于 是 ， 元 素 移 动 的 总 次 数 不 会 超过 2ulogs(u+1)。 结 果 是 , u 次 合并 操作 所 需要 的 时 
间 为 O(ulogu)。1 次 初始 化 、u 次 合并 操作 和 了 次 搜索 的 复杂 度 为 O(ntulogu+/)。 


练习 
62. 程序 6-17 的 排序 算法 是 稳定 的 吗 ? 


63. 
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65. 


66. 


67. 


08. 


69. 
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比较 程序 6-17 和 程序 6-18 的 箱子 排序 函数 的 运行 时 间 ， 使 用 n=10 000, 50 000, 100 000 进 
行 测 试 。 计 算 由 类 chain 所 产生 的 开销 。 


.设计 一 个 方法 ， 它 应 用 基数 排序 思想 给 链表 排序 。 


1 ) 编写 方法 chain<T>::radixSort(r,d)， 它 使 用 基数 排序 思想 ， 按 递增 顺序 给 链表 排序 。 方 
法 的 输入 为 : 基数 r+、 按 基数 + 分 解 的 数字 的 个 数 4。 假设 定义 了 从 类 型 T 到 int 的 类 
型 转换 。 方 法 的 复杂 度 应 为 O(d(r+n))。 证 明 这 个 复杂 度 成 立 。 

2 ) 使 用 自己 设计 的 测试 数据 来 测试 方法 的 正确 性 。 

3 ) 比较 你 的 方法 和 基于 链表 的 插入 排序 方法 的 性 能 。 为 此 可 使 用 n=100, 1000, 10 000; 
r=10 和 d=3。 

1 ) 编写 一 个 方法 ， 使 用 r=n 的 基数 排序 算法 对 个 0~n*-1 范围 内 的 整数 进行 排序 。 方 法 
的 复杂 度 应 为 O(cn)。 证 明 这 个 复杂 度 成 立 。 假 设 整数 存储 在 链表 中 ， 链 表 的 元 素 类 型 
是 int。 

2 ) 测试 方法 的 正确 性 。 

3 ) 对 于 n=10，100，1000，10 000 和 c=2， 测 量 方法 的 运行 时 间 。 用 表格 和 图 形 显示 测量 
结果 。 

一 堆 n 组 卡片 。 每 张 卡片 有 三 个 域 : 卡片 的 组 号 、 卡 片 的 样式 及 卡片 的 面值 。 每 组 最 多 有 

52 张 卡片 ( 因为 每 一 组 可 能 有 丢失 的 卡片 )， 因 此 该 堆 卡 片 最 多 有 52n 张 。 可 以 假设 每 组 

卡片 至 少 有 一 张 ， 因 此 卡片 总 数 至 少 为 n。 

1 ) 按照 组 号 对 卡片 进行 排序 ， 对 组 号 相同 的 卡片 按 样式 排序 ， 对 样式 也 相同 的 卡片 按 其 
面值 排序 。 应 该 采用 三 次 箱子 排序 过 程 来 完成 这 种 排序 。 

2 ) 编写 一 段 程 序 ， 输 入 为 n 和 一 个 卡片 堆 ， 输 出 为 有 序 的 卡片 。 把 卡片 堆 描述 为 一 个 链 
表 ， 链 表 节 点 包含 如 下 域 : deck、suit、face 和 link。 程 序 的 复杂 度 应 为 O(n)， 证 明 这 
个 复杂 度 成 立 。 

3 ) 测试 程序 的 正确 性 。 

[ 凸 包 ] 

1 ) 令 u、v、w 是 平面 上 的 三 个 点 。 假 设 这 三 点 不 在 同一 直线 上 。 编 写 一 个 方法 ， 从 这 三 
个 点 所 构成 的 三 角形 中 取 一 个 点 。 

2 ) 令 5 是 一 个 平面 点 集 。 编 写 一 个 方法 来 判断 5S 的 所 有 点 是 否 共 线 。 如 果 共 线 ， 计 算出 
包含 所 有 点 的 最 短 直线 的 端点 。 如 果 不 共 线 ， 从 点 集中 找 出 三 个 不 共 线 的 点 。 利 用 这 
三 个 点 和 1) 的 方法 ， 确 定 8 凸 包 内 的 一 个 点 。 方 法 的 复杂 度 应 为 O(n)。 证 明 这 个 复杂 
度 成 立 。 

3 ) 使 用 1) 和 2) 的 代码 ， 把 图 6-13 的 算法 细 化 成 一 个 C++ 程序。 程序 的 输入 为 点 集 5， 
输出 为 5 的 凸 包 。 在 输入 5 时 ， 可 把 点 存 人 双向 链表 之 中 ， 然 后 按照 极 角 对 这 些 点 排 
序 。 排 序 时 ， 可 使 用 第 2 章 的 一 个 排序 算法 , 或 者 任何 一 个 复杂 度 为 O(nlogn) 的 排序 
算法 。 

4 ) 编写 其 他 的 凸 包 程序 ， 它 不 用 双向 链表 ， 而 使 用 单 向 链表 或 数组 链表 。 

5 ) 测试 程序 的 正确 性 。 

使 用 单 向 链表 来 完成 练习 67。 用 练习 24 的 思想 ， 以 确保 在 图 6-13 的 步骤 3 中, 其 for 循 

环 的 复杂 度 为 O(n)。 

给 出 一 种 整数 的 表示 方法 ， 它 适用 于 对 任意 大 的 整数 所 进行 的 算术 运算 ， 而 且 运 算 结果 没 
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有 精度 损失 。 编 写 一 个 C+ 方法 ,输入 和 输出 大 的 整数 ， 而 且 实 施 算术 运算 加 、 减 、 乘 
和 除 。 除 法 返回 两 个 整数 : 商 和 余数 。 
70. [多项式 ] 一 个 阶 数 为 4 的 一 元 多 项 式 ( univariate polynomial ) 形式 如 下 : 
CA 4 CANX + Caoxd + + co 
其 中 cv 关 0, ci 是 系数 ，d，qd-1,，… 是 指数 。 根 据 定 义 ,，4 是 非 负 整 数 。 可 以 假设 ， 系 数 
也 是 整数 。 每 个 cr 都 是 多 项 式 的 一 个 项 。 我 们 要 设计 一 个 C++ 类 ， 它 支持 多 项 式 算术 运 
算 。 为 此 ， 需 要 把 每 一 个 多 项 式 表示 成 一 个 由 系数 构成 的 线性 表 (co,ci,c2,…,c4)。 
设计 一 个 C++ 类 polynomial， 它 包含 一 个 数据 成 员 degree， 表 示 多 项 式 的 阶 数 。 当 
然 ， 它 还 可 能 包含 其 他 的 数据 成 员 。 这 个 类 应 支持 以 下 操作 : 
1 ) polynomial() 一 一 创建 一 个 0 阶 多 项 式 。 这 个 多 项 式 的 阶 数 为 0， 不 包含 任何 项 。 它 是 
类 的 构造 函数 。 
2 ) degree() 一 一 返回 多 项 式 的 阶 数 。 
3 ) input(inStream) 一 一 从 输入 流 inStream 读 人 一 个 多 项 式 。 可 以 假设 输入 流 包含 多 项 式 的 
阶 数 和 一 个 系数 表 ， 系 数 表 中 的 系数 按 指数 递增 的 次 序 排列 。 
向 输出 流 outStream 输出 一 个 多 项 式 。 输 出 流 的 形式 应 该 与 输入 








4 ) output(outStream) 
流 的 形式 相同 。 

5 ) add(b) 一 一 加 上 和 多项式 b， 并 返回 所 得 结果 。 

6 ) subtract(b) 一 一 减 去 多 项 式 b， 并 返回 所 得 结果 。 

7) multiply(b) 一 一 乘 以 多 项 式 b， 并 返回 所 得 结果 。 

8 ) divide(b) 一 一 除 以 多 项 式 b， 并 返回 所 得 的 商 。 

9 ) valueOf(x) 一 一 返回 多 项 式 在 x 处 的 值 。 

测试 你 的 程序 。 

71. [多项式 ] 设计 一 个 链表 类 来 表示 和 处 理 一 元 多 项 式 ( 见 练习 70 )。 假 设 系数 为 整数 ， 链 表 
是 带头 节点 的 循环 链表 。 每 个 节点 有 三 个 域 : exp ( 指数 )、coeff ( 系数 ) 和 next (指向 下 
一 个 相 邻 节点 的 指针 )。 除 头 节点 以 外 ， 一 个 节点 对 应 多 项 式 的 一 个 非 0 项。 系数 为 0 的 
多 项 式 项 没有 节点 对 应 。 多 项 式 的 项 在 链表 节点 中 按 指数 递减 次 序 排列 ， 头 节点 的 指数 域 
为 -1。 图 6-17 是 一 些 相应 的 例子 。 


DEE mE 0 


a) 4 (x) =99X87+SxX30-25x 














0 E 和 en 


b) B(x)=-3x +2x1047x -2 











6) C(x)=0 
图 6-17 多 项 式 举 例 


一 个 一 元 多 项 式 的 输入 和 输出 是 一 个 序列 h, €1, Cl, €2, C23, €3, C3,°° “Cn, Cns 其 中 ei 表示 指数 ， 
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72. 
. 对 于 例 6-6 的 在 线 网 络 搜 索 问 题 ， 编 写 一 个 C++ 程序 。 把 该 问题 作为 在 线 等 价 类 问题 处 
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ci 表示 系数 , 表示 项 的 个 数 。 指 数 按 递减 次 序 排列 ， 妈 ej> es>…>en。 
你 的 类 应 该 支持 练习 70 的 所 有 方法 。 使 用 适当 的 多 项 式 测试 你 的 代码 。 
证 明 引 理 6-1。 


理 ， 并 使 用 链表 。 测 试 程序 的 正确 性 。 


. 证 明 例 6-5 所 叙述 的 策略 仅 当 不 存在 可 行 的 调度 方案 时 才 会 失败 。 
. 比较 程序 6-19 和 程序 6-21 运行 时 的 时 间 性 能 。 
.设计 程序 6-21 的 一 个 版 本 ， 用 数组 蔡 代 链表 。 


1 ) 测试 你 的 代码 。 
2 ) 新 程序 的 时 间 复 杂 度 是 多 少 ? 
3 ) 比较 程序 6-21 和 新 代码 的 性 能 。 


.设计 程序 6-21 的 一 个 版 本 ,链表 用 C++ 指针 ， 而 不 用 整数 指针 即 模拟 指针 )。 为 了 用 时 


间 0(1) 访问 元 素 i 的 节点 ,使 用 一 个 数组 theNode， 使 得 theNode[i 表示 一 个 指针 ， 指 向 
元 素 i 的 节点 。 

1 ) 测试 你 的 代码 。 

2 ) 计算 代码 的 复杂 度 。 

3 ) 比较 你 的 代码 和 程序 6-21 的 性 能 。 

对 于 例 6-5 的 调度 问题 编写 一 个 C++ 程序 。 把 该 问题 按照 在 线 等 价 类 问题 进行 处 理 ， 而 且 
使 用 链表 。 测 试 程序 的 正确 性 。 
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概述 


在 实际 应 用 中 ,数据 通常 以 表 的 形式 出 现 。 尽 管用 数组 来 描述 表 是 最 自然 的 方式 ， 但 为 
了 减少 程序 所 需 的 时 间 和 空间 ， 经 常 采用 自 定 义 的 描述 方式 。 例 如 ， 当 表 中 大 部 分 数据 为 0 
的 时 候 ， 就 会 用 自 定义 的 描述 方式 。 

本 章 首先 检查 了 多 维 数组 的 行 主 描述 方式 和 列 主 描述 方式 。 这 些 描 述 方式 把 多 维 数组 映 
射 成 一 维 数组 。 

矩阵 经 常用 二 维 数组 来 描述 。 然 而 ， 矩 阵 的 索引 通常 从 1 开始 ， 而 C++ 的 二 维 数组 是 从 
0 开始。 矩阵 的 操作 有 加 法 、 乘 法 和 转 置 ， 但 是 C++ 的 二 维 数组 不 支持 这 些 操作 。 因 此 我 们 
开发 了 类 matrix， 它 与 矩阵 的 关系 更 密切 。 

我 们 还 要 考察 具有 特殊 结构 的 矩阵 ， 如 对 角 抢 阵 、 三 对 角 和 矩阵 、 三 角 和 矩阵 和 对 称 和 矩阵 。 
关于 这 些 矩 阵 的 描述 方法 ， 自 定义 数组 与 二 维 数组 相 比 ， 不 仅 大 大 减少 了 存储 空间 ， 也 减少 
了 大 多 数 和 矩阵 操作 的 运行 时 间 。 

本 章 的 最 后 一 节 设计 了 稀 玖 和 矩阵 ( 即 大 部 分 元 素 为 0 的 矩阵 ) 的 数组 和 链表 描述 方式 ， 
对 0 元 素 做 了 特殊 的 处 理 。 


7.1 数组 
7.1.1 抽象 数据 类 型 


一 个 数组 的 每 一 个 实例 都 是 形 如 (索引 , 值 ) 的 数 对 集合 ， 其 中 任意 两 个 数 对 的 索引 
(index ) 都 不 相同 。 有 关 数 组 的 操作 如 下 : 
e 取 值 一 一 对 一 个 给 定 的 索引 ， 取 对 应 数 对 中 的 值 。 
e 存 值 一 一 把 一 个 新 数 对 加 到 数 对 集合 中 。 如 果 已 存在 一 个 索引 相同 的 数 对 ， 就 用 新 数 
对 覆盖 。 
这 两 个 操作 定义 了 抽象 数据 类 型 array (ADT 7-1 )。 


抽象 数据 类 型 array 
{ 
实例 
形 如 (index,value) 的 数 对 集合 ， 任意 两 个 数 对 的 索引 都 不 同 


操作 
get(index): 返回 索引 为 index 的 数 对 中 的 值 
set(index,value): 加 入 一 个 新 数 对 ， 如 果 索 引 相 同 的 数 对 已 存在 ， 则 用 新 数 对 覆盖 





ADT7-1 数组 的 抽象 数据 类 型 描述 
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例 7-1 上 个 星期 每 天 的 温度 ( 华氏 度数 ) 可 用 如 下 的 数组 来 表示 : 
high={ {Sunday,82}, (Monday,79), (Tuesday,85), (Wednesday,92), (Thursday,88), (Friday,89), 
(Saturday,91)} 
数组 的 名 称 为 high， 数 组 的 每 对 数据 都 包含 一 个 索引 ( 星期 几 ) 和 一 个 值 ( 当天 的 温度 )。 通 
过 如 下 操作 ， 可 以 将 Monday 的 温度 改变 为 83: 
set(Monday ，83) 
通过 如 下 操作 ， 可 以 确定 Friday 的 温度 : 
get(Friday) 
可 以 采用 如 下 的 数组 来 描述 每 天 的 温度 : 
high={ (0,82),(1,79),(2,85), (3,92),(4,88),(5,89),(6,91)} 
在 这 个 数组 中 ， 索 引 是 一 个 数值 ， 而 不 是 日 期 名 。 数 值 (0,1,2，… ) 代替 了 一 周 每 天 的 名 称 
(Sunday, Monday, Tuesday, *… )。 EE 


7.1.2 ”C++ 数组 的 索引 


数组 是 C++ 的 标准 数据 结构 ， 数 组 的 索引 ( 也 称 下 标 ) 具有 如 下 形式 : 
[al[iz][is]**[ix] 
其 中 i 是 非 负 整数 。 如 果 k 为 1， 则 数组 为 一 维 数组 ; 如 果 k 为 2， 则 为 二 维 数组 。i 是 索引 
的 第 一 个 坐标 ,i 是 第 二 个 ,ii 是 第 Kk 个 。 在 C++ 中 ,一 个 3 维 整 型 数组 score 可 用 如 下 语句 
来 创建 : 


int score[ui] [uz] [ui] 


其 中 ;是正 常量 或 表示 正常 量 的 表达 式 。 对 于 这 样 一 个 数组 描述 ， 索 引 i 的 取 值 范围 是 : 
0 三 i<u，1 j < 3。 因 此 ， 该 数组 最 多 可 容纳 n=uiuzu 个 值 。 因 为 数组 score 的 每 个 值 都 是 
整数 ， 且 每 个 整数 占 4 字 节 ， 所 以 整个 数组 的 存储 空间 大 小 sizeofl(score) 是 42 字 节 。C++ 编 
译 器 将 为 数组 预 留 这 么 多 字 节 的 存储 空间 。 如 果 预 留 空间 的 起 始 字 节 地 址 为 start， 则 该 空间 
将 一 直 延 伸 到 地 址 为 start+sizeof(score)-1 的 字 节 。 


7.1.3 行 主 映射 和 列 主 映 射 


数组 的 应 用 需要 我 们 把 数组 元 素 序 列 化 ， 即 按 一 维 顺 序 排列 。 例 如 ， 数 组 元 素 只 能 一 次 
输出 或 输入 一 个 。 因 此 ， 我 们 必须 确定 一 个 输出 或 输入 的 顺序 。7.3 节 和 7.4 节 有 若干 个 二 维 
表 (矩阵 )， 我 们 要 把 它们 映射 成 一 维 数组 。 为 此 ， 我 们 把 表 元 素 的 二 维 排列 方式 转变 为 一 维 
排列 方式 。 

令 n 是 一 个 上 维 数组 的 元 素 个 数 。 该 数组 的 序列 化 需要 借助 一 个 映射 函数 ， 把 数组 的 一 
个 索引 [如][i2]J[aj…[id 映射 为 [0，n-1] 范围 中 的 一 个 数 map(ii,izyia…,itz)， 把 索引 为 [2][iz][ia]*… 
[i4] 的 数组 元 素 映 射 为 序列 中 第 map(ii,i,B，…,ij) 的 元 素 。 

当 数 组 维 数 是 1( 即 k=1 ) 时 ， 映 射 函数 是 

map(ii) = (7-1) 

当 数 组 维 数 是 2 时， 索引 可 按 图 7-1 所 示 的 表 形 式 进行 排列 ， 第 一 个 坐标 相同 的 索引 位 

于 同一 行 ， 第 二 个 坐标 相同 的 索引 位 于 同一 列 。 
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在 图 7-1 中 ， 从 第 一 行 开 始 ， 依 次 对 每 一 行 的 索引 从 左 至 右 连续 编号 ， 得 到 图 7-2a 所 示 


的 映射 结果 。 它 把 二 维 数组 的 索引 映射 为 [0, n—1] 中 IolIOl [oll 1] [ol [0][3] [01[4| [0][5] 
oN DO | a] 
的 数 ， 这 种 映射 方式 称 为 行 主 映射 (row major jg all Iza 加 | 回 [s ls 


mapping )。 索 引 对 应 的 数 称 为 行 主 次序 (row-major 

order )。 图 7-2b 是 另 一 种 映射 模式 ， 称 为 列 主 映射 图 7-1 整 型 数组 score[31[6] 的 察 引 排列 表 
(column major mapping )。 在 列 主 喘 射 中 ， 对 索引 的 编号 从 最 左 列 开始 ， 依 次 对 每 一 列 的 索引 
从 上 到 下 连续 编号 。 


E 证 法 六 六 潮 0 3 机 13 

6 7 8 9 10 1 1 4 7 10 13 16 

12 13 14 15 16 17 2 5 8 11 14 17 
a) 行 主 映射 b) 列 主 映射 


图 7-2 映射 一 个 二 维 数 组 
在 行 主 次 序 中 ， 映 射 函 数 为 : 


map(ii,is) = iiU2+ i (7-2) 
其 中 是 数组 的 列 数 。 公 式 (7-2 ) 之 所 以 正确 ， 是 在 于 行 主 映 射 模式 在 对 索引 [ 问 [P] 编号 
时 ，0 至 im-1 行 中 的 nz 个 元 素 以 及 第 六 行 中 的 前 二 个 元 素 都 已 经 编号 。 

我 们 用 图 7-2a 的 3 x 6 数组 来 验证 行 主 映射 函 数 。 因 为 列 数 为 6， 所 以 映射 公式 为 : 

map(i1,i2) = 6i1+i 

因此 有 map(1,3) = 6+3=9，map(2,5) = 6*2+5 = 17。 这 与 图 7-2a 的 编号 相同 。 

二 维 数组 的 行 主 映射 模式 可 以 扩展 为 二 维 以 上 数组 。 对 于 一 个 二 维 数 组 ， 在 行 主 次 序 中 ， 
首先 列 出 所 有 第 一 个 坐标 为 0 的 索引 ， 然 后 是 第 一 个 坐标 为 1 的 索引 ， 等 等 。 第 一 个 坐标 相 
同 的 索引 按 其 第 二 个 坐标 的 递增 次 序 排列 。 即 索引 按照 词典 序 排列 。 对 于 一 个 三 维 数组 ， 首 
先 列 出 所 有 第 一 个 坐标 为 0 的 索引 ， 然 后 是 第 一 个 坐标 为 1 的 索引 ， 等 等 。 第 一 个 坐标 相同 
的 索引 按 其 第 二 个 坐标 的 递增 次 序 排列 ， 前 两 个 坐标 相同 的 索引 按 其 第 三 个 坐标 的 递增 次 序 
排列 。 例 如 ， 数 组 score[3][2][4] 的 索引 按 行 主 次 序 排列 为 : 

[0][01[0] [ol[ol[ [oo[2 [oo LOLUIO LOG [Ol]2] [O13] 

[1[olol [Ho [Urol2] [rol3] [Do ID] [OO][2] [003] 

[2][01[0 [2][0[ [£2JFON2] C27CON3] ED ED DC] [2][11[3] 

三 维 数组 的 行 主 映 射 函 数 为 : 

map(ii, a, B3)=iWw 2 十 天 23 十 六 

为 了 认识 这 个 映射 函数 的 正确 性 ， 我 们 来 观察 检验 。 在 第 一 个 坐标 为 i 的 元 素 之 前 都 是 
第 一 个 坐标 小 于 的 元 素 ， 第 一 个 坐标 都 相同 的 元 素 个 数 为 wu3。 因 此 第 一 个 坐标 小 于 i 的 
元 素 个 数 为 iiuzu3。 第 一 个 坐标 等 于 且 第 二 个 坐标 小 于 产 的 元 素 个 数 为 zz， 第 一 个 坐标 等 
于 上 且 第 二 个 坐标 等 于 忆 且 第 三 个 坐标 小 于 的 元 素 个 数 为 i。 


7.1.4 用 数组 的 数组 来 描述 


C++ 用 所 谓 数组 的 数组 来 表示 一 个 多 维 数组 。 一 个 二 维 数组 被 表示 为 一 个 一 维 数组 ， 这 
个 一 维 数组 的 每 一 个 元 素 还 是 一 个 一 维 数 组 。 为 表示 二 维 数组 
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dt 3 [和 后] 
实际 上 是 创建 一 个 长 度 为 3 的 一 维 数组 x, x 的 每 一 个 元 素 是 一 个 长 度 为 5 的 一 维 数组 - 图 7-3 
琶 大 了 这 生生 全 结 直 构 。 其 中 有 4 块 ， 浅 色 的 一 块 存储 了 三 个 指针 ， 其余 的 每 一 块 用 来 存储 $ 
人 每 个 指针 和 每 个 整 型 各 占 4 字 节 ， 一共 
72 字 节 

C++ 对 元 素 x[D] 的 定位 过 程 是 : 利用 一 维 数组 
的 映射 函数 〔 见 公式 (7-1 )) 找到 指针 x[i， 它 是 第 i 
行 第 0 个 元 素 的 地 址 ; 再 利用 一 维 数组 的 映射 吨 数 找 
到 第 i 行 中 索引 为 [j 的 元 素 。 图 7-3 ”一 个 二 维 数组 的 存储 结构 

一 个 三 维 数组 被 表示 为 一 个 一 维 数 组 ， 这 个 一 维 数组 的 每 一 个 元 素 是 一 个 二 维 数 组 ， 每 
一 个 二 维 数组 如 图 7-3 所 示 。 


7.1.5 行 主 描述 和 列 主 描述 


另 有 一 种 是 C++ 没有 的 表示 方法 ， 它 创建 一 个 一 维 数组 ， 然 后 利用 行 主 映射 或 列 主 映 
射 ， 把 多 维 数 组 映射 到 这 个 一 维 数组 。 用 这 种 方法 把 上 一 节 的 整 型 二 维 数组 x[3][5] 映射 到 一 - 
个 长 度 为 15 的 整 型 数组 : 


int y[1S9]7 


它 只 需要 一 块 连续 的 、 能 够 容纳 15 个 整数 的 存储 空间 。 存 储 空间 的 大 小 从 72 字 节 降 到 60 
字 节 。 


[ol IT1}] T21] ‘#3 0 





为 了 访问 元 素 x[i]0]， 必 须 利 用 二 维 上 映射 函 数 ( 见 行 主 映射 公式 (7-2 )) 计算 出 一 
然后 利用 一 维 上 映射 函数 访问 元 素 yf[u]。C++ 数组 中 是 行 主 描 述 法 快 还 是 列 主 描述 法 快 ， 这 最 
决 于 是 先 用 一 维 映射 函数 定位 指针 ， 再 用 指针 定位 元 素 的 方法 快 ， 还 是 用 二 维 映 射 函 数 定位 
元 素 的 方法 快 。 


7.1.6 不 规则 二 维 数组 


所 谓 规 则 的 二 维 数组 是 指 每 行 元 素 个 数 相同 的 二 维 数组 。 例 如 ， 图 7-1 的 3x6 数组 score， 
它 的 每 一 行 有 6 个 元 素 。 当 一 个 二 维 数组 有 两 行 或 更 多 的 行 ， 它 们 的 元 素 个 数 不 等 时 ， 这 个 数 
组 称 为 不 规则 数组 ( irregular array )。 程 序 7-1 创建 并 使 用 了 一 个 不 规则 数组 。 注 意 ， 一 个 二 维 
数组 是 否 是 规则 的 取决 于 每 一 行 的 元 素 个 数 是 否 相同 ， 而 元 素 的 访问 方式 都 是 相同 的 。 


程序 7-1 一 个 不 规则 二 维 数组 的 创建 和 使 用 
int main (void) 


{ 
int numberOQfRows = 5; 


1/ 定义 每 一 行 的 长 度 

int lengthi5] = (6, 3 4, 2, 7}); 
/声明 一 个 二 维 数组 变量 

ee 


int **irregularArray = new int* [numberOfRows]; 


// 分 配 每 一 行 的 空间 





for (int i = 0; i < numberOfRows; i++) 
irregularArrayl[li] = new int [lengthl[i]]; 


1/ 像 使 用 规则 数组 一 样 使 用 不 规则 数组 


irregularArray[2][3] = 5; 
irregularArray[4][6] = irregularArray[2][3] + 2; 
irregularArray[1]{1] = 3; 


// 输出 选择 的 数组 元 素 

cout << irregularRArray[2][3] << endl; 
cout << irregularArray[4] [6] << endl; 
cout << irregularArray[1] [i] << endil; 


return 0; 


练习 


1. 1 ) 按 行 主 次 序列 出 数组 score[2][3][2][2] 的 索引 。 

2 ) 给 出 四 维 数组 的 行 主 映射 函数 。 

. 给 出 五 维 数组 的 行 主 映射 函数 。 

. 给 出 上 维 数组 的 行 主 映 射 函数 。 

.1 ) 按 列 主 次 序列 出 数组 score[2][3][4] 的 索引 。 注 意 ， 此 时 首先 列 出 第 三 个 坐标 为 0 的 全 

部 索引 ， 然 后 列 出 第 三 个 坐标 为 1 的 全 部 索引 ， 以 此 类 推 。 第 三 个 坐标 相同 的 索引 按 其 
第 二 个 坐标 的 次 序 进 行 排列 ， 后 两 个 坐标 都 相同 的 索引 按 其 第 一 个 坐标 的 次 序 排 列 。 

2 ) 给 出 三 维 数组 的 列 主 映射 函数 。 

. 1 ) 按 列 主 次 序列 出 数组 score[2][3][2][2] 的 索引 。 

2 ) 给 出 四 维 数 组 的 列 主 映 射 函数 ( 参考 练习 4 )。 

. 给 出 £ 维 数组 的 列 主 映 射 函 数 。 

. 假定 把 一 个 二 维 数 组 的 元 素 从 最 后 一 行 开 始 ， 每 一 行 从 右 至 左 进行 映射 。 

1 ) 按 这 种 映射 次 序列 出 数组 score[3][5] 的 索引 。 

2 ) 给 出 数组 score[i][zz] 的 映射 函数 。 

假定 把 一 个 二 维 数组 的 元 素 从 最 后 一 列 开始 ， 每 一 列 从 项 至 底 进 行 映 射 。 

1 ) 按 这 种 次 序列 出 数组 score[3][5] 的 索引 。 

2 ) 给 出 数组 score[z][ze] 的 映射 函数 。 

一 个 m xn 的 二 维 数组 有 mn 个 元 素 。 

1 ) 当 用 C++ 的 二 维 数组 来 存储 时 ， 存 储 空间 需要 多 大 ? 当 用 行 主 映射 下 的 一 维 数组 来 存 
储 时 ， 存 储 空间 需要 多 大 ?假定 元 素 是 整 型 的 。 先 处 理 m=10 和 n=2 的 情况 ， 再 处 理 一 
般 情 况 。 

2 ) 两 种 存储 空间 需求 的 比例 有 多 大 ? 

10. 一 个 mxnxp 的 三 维 数组 有 mnp 个 元 素 。 

1 ) 当 用 C++ 的 三 维 数组 来 存储 时 ， 存 储 空间 需要 多 大 ? 如 果 用 行 主 映射 下 的 一 维 数组 来 
存储 时 ， 那 么 存储 空间 需要 多 大 ?假定 元 素 是 整 型 的 。 先 处 理 m=10、n=4 和 p=2 的 情 
况 ， 再 处 理 一 般 情况 。 
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2 ) 两 种 存储 空间 需求 的 比例 有 多 大 ? 
3 ) 在 什么 时 候 ， 一 个 存储 模式 比 另 一 个 存储 模式 快 ? 
11. 一 个 mxnxpxg 的 四 维 数组 有 mnpg 个 元 素 。 
1 ) 当 用 C++ 的 四 维 数组 来 存储 时 ， 存 储 空 间 需 要 多 大 ? 当 用 行 主 映射 下 的 一 维 数 组 来 存 
储 时 ， 存 储 空间 需要 多 大 ? 假定 元 素 是 整 型 的 。 
2 ) 两 种 存储 空间 需求 的 比例 有 和 多大? 
12. Ui xwzx… Xun 的 k 维 数组 有 uiu2…ui 个 元 素 。 
1 ) 当 用 C++ 的 大 维 数组 来 存储 时 ， 存 储 空间 需要 多 大 ? 当 用 行 主 映射 下 的 一 维 数组 来 存 
储 时 ， 存 储 空间 需要 多 大 ? 假定 元 素 是 整 型 的 。 
2 ) 两 种 存储 空间 需求 的 比例 有 多 大 ? 
3 ) 在 什么 时 候 ， 一 个 存储 模式 比 另 一 个 存储 模式 快 ? 


7.2 矩阵 
7.2.1 定义 和 操作 


一 个 mxn 的 矩阵 (matrix ) 是 一 个 m 行 、n 列 的 表 ( 如 图 7-4 所 示 )，m 和 nn 是 和 矩阵 的 
维 数 ( dimension )。 
例 7-2 和 矩阵 通常 用 来 组 织 数据 。 例 如 ， 要 登记 世界 上 的 次 ee 


源 ， 可 以 首先 生成 一 个 令 我 们 关注 的 资源 类 型 表 ， 这 个 表 可 能 包 人 0 
含 矿产 ( 金 、 银 等 )、 动 物 ( 狮子 、 大 象 等 )、 人 (物理 学 家 、 工 入 |6 4 0 
程 师 等 ) 等 。 然 后 确定 每 一 种 资源 在 每 一 个 国家 的 数量 。 这 些 数据 行 | 8 2 7 : 

可 以 组 织 在 一 个 二 维 表 中 ， 其 中 每 一 列 对 应 一 个 国家 ,每 一行 对 应 。 行 9 | 1 4 。 | 


一 种 资源 。 这 样 就 得 到 了 一 个 资源 矩阵 : 天 列 对 应 n 个 国家 ， m 行 7-4 | 一 个 5x4 的 矩阵 
对 应 m 种 资源 。 用 符号 M (i, j) 来 引用 和 矩阵 M 的 第 i 行 、 第 j 列 

(1i<m,， 1 jn) 的 元 素 。 如 果 第 i 行 代表 猫 ， 第 j 列 代 表 美 国 ， 那 么 asset(i, 就 代 
表 美 国 所 拥有 的 猫 的 总 数 。 

图 7-5a 是 一 个 资源 矩阵 ， 有 4 个 国家 ， 分 别 用 A、B、C 和 DD 表示 ; 有 三 种 资源 : 白金 、 
黄金 和 白银 。B 国家 有 5 个 单位 的 白金 (asset(1,2)=5 )、2 个 单位 的 黄金 (asset(2,2)=2 ) 和 10 
个 单位 的 白银 〈asset(3,2)=10 )。 

图 7-5b 的 矩阵 是 在 三 个 不 同 经 济 环境 中 每 种 资源 的 单位 价值 。 在 第 三 个 经 济 环境 中 ，1 
单位 白金 的 价值 是 value(1,3)=$50 ; 1 单位 黄金 的 价值 是 value(2,3)=$40 ; 1 单位 白银 的 价值 是 
value(3,3)=$2。 





a) 资源 


图 7-5 资源 和 价值 矩阵 
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矩阵 最 常见 的 操作 是 矩阵 转 费 、 矩 泗 相 加 、 和 矩阵 相 乘 。 一 个 m xn 的 和 矩阵 MM 转 置 之 后 是 

一 个 nx m 的 矩阵 M ， 它 们 的 关系 是 : 
MNMGD), lisn, ls<js<m 

两 个 窍 阵 仅 当 维 数 相 同时 ( 即 它们 的 行 数 和 列 数 都 分 别 相 等 ) 才 可 以 相 加 。 两 个 mxn 

的 矩阵 4 和 8B 相 加 之 后 是 一 个 nxn 的 矩阵 C， 如 下 所 示 : 
CN=AC I HBGN), ls<i<sn, 1l1<j<m (7-3.) 

一 个 mxn 的 矩阵 4 和 一 个 gxp 的 矩阵 8B， 只 有 当 4 的 列 数 等 于 8B 的 行 数 ( 即 n=g ) 

时 ， 才 可 以 相 乘 4*B。4*8 的 结果 是 一 个 m xp 的 矩阵 C， 它 们 的 关系 是 ; 


CE) = ACGOD*BE), 1<i 和 mm1 和 JE<p 
=| 


例 7-3 假定 有 两 家 机 构 分 别 给 出 了 如 例 7-2 所 描述 的 资源 矩阵 ， 而 且 没 有 重复 累计 的 数 
据 。 如 果 这 是 两 个 m xn 的 和 矩阵 assertl 和 assert2， 那 么 要 得 到 所 需要 的 资源 矩阵 ， 只 需 把 矩 
阵 assertl 和 assert2 相 加 即 可 。 
接 下 来 ， 假 定 有 另 一 个 m xs 的 和 矩阵 value( 如 图 7-5b 所 示 )，value(i,j) 代表 在 经 济 环境 j 
下 ， 资 源 i 的 单位 价值 。CV(i,j) 代表 在 经 济 环 境 j 下 国家 i 所 拥有 的 资源 总 价值 。 基 于 图 7-5 
的 数据 ， 在 经 济 环境 3 下 ， 国 家 B 所 拥有 的 资源 总 价值 为 : 
CKV2,3) = ( 白金 数量 * 白金 单位 价值 ) + (黄金 数量 * 黄金 单位 价值 ) 
+ (日 银 数量 * 白银 单位 价值 ) 
=asset(1,2)*value(1,3) + asset(2,2)*value(2,3) + asset(3,2)*value(3,3) 
=5*50+2*40+10*2 
=330 
CV 是 一 个 mxs 和 窍 阵 ， 而且 


CV(i,)) = Dasset(k, 7) * value(k,)) = Zassert'(i,f) * value (k,7) 
k=1 k=} 





于 是 CV 满足 方程 
CV = asset'*value 


图 7-6a 是 图 7-5a 的 矩阵 asset 的 转 置 矩阵 ， 图 7-6b 是 矩阵 CV。 





a) asset™ b)» CrY=asset'*value 


图 7-6 答 阵 转 置 和 乘积 的 例子 


国 
我 们 在 第 2 章 已 经 讨论 过 按照 二 维 数组 来 计算 矩阵 转 置 、 抢 阵 相 加 和 和 抢 阵 相 乘 的 CH+ 函 
数 ( 见 程序 2-21, 程序 2-19, 程序 2-22 和 程序 2-23 )。 


7.2.2 类 matrix 


一 个 rows x cols 的 整 型 矩阵 M 可 用 如 下 的 二 维 整数 数组 来 描述 : 


int x[rows] {cois]; 
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其 中 M(Gij) 对 应 于 x[i-1J0-1]。 这 种 描述 形式 使 应 用 时 的 数组 索引 和 和 矩 阵 索 引 不 同 : 数组 的 索 
引 从 0 开始， 矩阵 的 索引 从 1 开始 。 男 一 种 描述 形式 是 把 数组 x 定义 为 


int x[rows+1] [cols+1]; 


并 且 对 形式 为 [0][*] 和 [*][0] 的 数组 元 素 弃 之 不 用 。 本 节 我 们 所 开发 的 一 个 矩阵 描述 方法 ， 
是 用 行 主 次 序 把 矩阵 映射 到 一 个 一 维 数组 中 。 

类 matrix 用 一 个 一 维 数 组 element 存储 ， 在 行 主 次 序 中 ， 储 存 rows x cols 矩阵 的 rows*cols 
个 元 素 。 程 序 7-2 是 类 头 ， 即 类 声明 。 我 们 要 重 载 函数 操作 符 ( )， 使 得 在 程序 中 对 和 矩阵 索引 的 
用 法 和 在 数学 中 的 一 样 。 我们 还 要 重 载 算术 操作 符 ， 使 它们 能 够 用 于 和 矩阵 对 象 。 


程序 7-2 ”和 矩阵 类 matrix 的 声明 





template<class T> 
class matrix 
{ 
friend ostream& operator<< (ostreamg&, const matrix<T>&);} 
public: 
matrix(int theRows = 0, int theColumns = 0); 
matrix(const matrix<T>&); 
~matrix() {delete [] element;)}] 
int rows() const {return theRows;} 
int columns() const {return theColumns;} 
工人 operator() (int is int 1) const; 
matrix<T>& operator=(const matrix<T>&); 
matrix<T> operator+() const; ll/unary + 
matrix<T> operator+(const matrixy<T>&) const; 
matrix<T> operator-() const; ll/unary minus 
matrix<T> operator- (const matrix<T>&) const; 


matrix<T> operator* (const matrix<T>&) const; 





matrix<T>& operator+= (const TE&); 


private: 
int theRows, /矩阵 的 行 数 
theColumns; 1// 矩阵 的 列 数 
T *element; // 数组 element 


并 有 


程序 7-3 是 矩阵 类 matrix 的 构造 函数 和 复制 构造 函数 。 注 意 ， 构 造 函 数 不 仅 生成 行 数 和 
列 数 都 大 于 0 的 矩阵 ， 也 生成 0 x 0 的 矩阵 。 


程序 7-3 ”矩阵 类 matrix 的 构造 函数 和 复制 构造 函数 


template<class T> 
matrix<T>: :matrix(int theRows, int theColumns) 


{1/ 矩阵 构造 函数 
// 检验 行 数 和 列 数 的 有 效 性 
if (theRows < 0 || theColumns < 0) 


throw illegalParameterValue ("Rows and columns must be >= 0")， 
if ((theRows == || theColumns == 0) 
&& (theRows != 0 || theColumns != 0)) 
throw illegalParameterValue 


(“Either both or neither rows and columns should be zero"); 





/ 创建 矩阵 

this->theRows = theRows; 
this->theColumns = theColumns; 

element = new T [theRows * theColumns]; 


} 


template<class T> 
matrix<T>: :matrix(const matrix<T>& m) 
{1/ 矩阵 的 复制 构造 函数 
/ 创建 矩阵 
theRows = m.theRows; 
theColumns = m.theColumns; 
element = new T [theRows * theColumns]; 


1// 复制 m 的 每 一 个 元 素 

copy (m.element, 
m.element + theRows * theColumns, 
element); 





程序 7-4 是 重 载 赋值 操作 符 =。 
程序 7-4 ”和 矩阵 类 matrix 对 赋值 操作 符 二 的 重 载 





template<class T> 
matrix<T>& matrix<T>: :operator=(const matrix<T>& m) 
{/ 赋值 . (*this) = m 


if (this != &m) 
{// 不 能 自己 复制 自己 
delete [] element; 


theRows = m.theRows; 

theColumns = m.theColumns; 

element = new T [theRows * theColumns]; 

/复制 每 一 个 元 素 

Copy (m.element, 
m.element + theRows * theColumns, 
element); 

} 


return *this; 


为 了 用 左右 括号 来 表示 和 矩阵 索引 ， 我们 重 载 C++ 的 函数 操作 符 0， 它 可 以 具有 任意 个 数 
的 参数 ， 不 过 在 矩阵 应 用 中 ， 我 们 需要 两 个 整 型 参数 。 程 序 7-5 是 重 载 函 数 操作 符 () 的 代码 。 
它 的 返回 值 是 对 索引 为 (ijj) 的 矩阵 元 素 的 引用 ， 这 个 引用 既 可 以 用 来 取 值 ， 也 可 以 用 来 赋值 。 
例如 ， 语句 a(i,jj) = 2 和 语句 x = a(ij) 都 可 以 ， 其 中 a 是 矩阵 。 


程序 7-5 和 矩阵 类 matrix 对 () 操作 符 的 重 载 


template<class T> 
Tg matrix<T>: :operator() (int i, int j) const 
{// 返回 对 元 素 element (i,j) 的 引用 
if {i < 1 || i > theRows 
11j3<11|j > theCcolumns) 
throw matrixIndexOutOofBounds (); 
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return element[(i - 1) * theColumns + 3] - 1]; 
} 





程序 7-6 是 重 载 操作 符 +， 以 实现 矩阵 加 法 。 因 为 矩阵 被 映射 到 一 维 数组 ， 所 以 两 个 矩 
阵 相 加 只 需要 一 层 for 循环 。 诸 如 和 矩阵 的 一 元 增值 操作 ( 每 个 元 素 增加 相同 的 值 ) 和 和 矩阵 减法 
的 代码 都 与 矩阵 加 法 的 代码 相似 。 


程序 7-6 ”和 矩阵 加 法 


template<class T> 
matrix<T> matrix<T>:; :operator+ (const matrix<T>& m) const 


{1/ 返回 矩阵 Ww = (*this) + m 
if (theRows != m.theRows 
[| theColumns != m.theColumns) 


throw matrixSizeMismatch(); 


/生成 结果 矩阵 

matrix<T> w(theRows, theColumns); 

for (int i = 0; i < theRows * theColumns; i++) 
w.element [il = element[i] + m.element [i]; 

return w; 


} 


在 程序 7-7 的 矩阵 乘法 代码 中 有 三 层 符 套 for 循环 ， 循 环 结构 与 程序 2-23 的 相似 。 最 
内 层 的 循环 利用 公式 (7-3 ) 来 计算 和 矩阵 乘积 后 索引 为 j) 的 元 素 。 进 入 最 内 层 循环 时 ， 
element[ct] 是 第 i 行 的 第 一 个 元 素 ，m.element [cm] 是 第 j 列 的 第 一 个 元 素 。 为 了 得 到 第 i 行 
的 下 一 个 元 素 , 将 ct 增加 1， 因 为 在 行 主 次 序 中 同一 行 的 元 素 是 连续 存放 的 。 为 了 得 到 第 j 
列 的 下 一 个 元 素 ， 将 cm 增加 m.theColumns， 因 为 在 行 主 次 序 中 同一 列 的 两 个 相 邻 元 素 在 位 
置 上 相差 m.theColumns。 当 最 内 层 循 环 完成 时 ，ct 指向 第 i 行 的 最 后 一 个 元 素 ，cm 指向 第 
j 列 的 最 后 一 个 元 素 。 对 于 j 循环 的 下 一 次 循环 ， 起 始 时 必须 将 ct 指向 第 i 行 的 第 一 个 元 素 ， 
cm 指向 m 的 下 一 列 的 第 一 个 元 素 。 对 ct 的 调整 是 在 最 内 层 循环 完成 后 进行 的 。 当 j 循环 完 
成 时 ， 需 要 将 ct 指向 下 一 行 的 第 一 个 元 素 ， 而 将 cm 指向 第 一 列 的 第 一 个 元 素 。 

像 程 序 4-4 所 采用 的 ikj 顺序 一 样 ， 通 过 减少 缓存 未 命中 事件 的 次 数 可 以 提高 矩阵 乘法 代 
码 的 效率 。 和 矩阵 剩余 方法 的 代码 可 以 从 本 书 网 站 上 获得 。 


程序 7-7 和 矩阵 乘法 





template<class T> 
matrix<T> matrix<T>: ;operator* (const matrix<T>& m) const 
{/ 矩阵 乘法 . 返回 结果 矩阵 w = (*this) * m 
if (theColumns != m.theRows) 
throw matrixSizeMismatch(); 


matrix<T> w(theRows、 m.theColumns); 1// 结果 矩阵 


/定义 矩阵 *this， 台 和 w 的 游标 且 初 始 化 以 为 (1,1) 元 素 定位 


int ct = 0, cm = 0, cw = 0; 


/对 所 有 工 和 j 计算 w(i,j) 


for (int i = 1; i <= theRows; i++) 
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{1/ 计算 结果 矩阵 的 第 i 行 


for (int jj = 1; <= m.theCcolumns; j++) 
{ 1/ 计算 w(i,j) 第 一 项 
T sum = element[ct] * m.element[cm]; 


// 累加 其 余 所 有 项 

for (int kK = 2; k <= theColumns; K++) 

{ 
C++ 十 1 *this 中 第 工行 的 下 一 项 
cm += m.theColumns; /mm 中 第 于 列 的 下 一 项 
sum += element [ct] * m.element[cm]; 


} 
w.element [cw++] = sum; 1/ 存储 在 w (i,j) 


/ 从 行 的 起 点 和 下 一 列 从 新 开始 
ct -= theColumns -— 1; 
cm = Jj; 

} 

1/ 从 下 一 行 和 第 一 列 重新 开始 

ct += theColumns; 

cm = 0; 

} 


return w; 


} 


复杂 度 

当 了 是 C++ 的 一 个 内 部 数据 类 型 时 ( 例如 整 型 、 实 型 )， 和 矩阵 构造 函数 和 析 构 函数 的 
复杂 度 是 0(1)。 当 TT 是 一 个 用 户 自 定义 的 数据 类 型 时 ， 构造 函数 和 析 构 函数 的 复杂 度 为 
O (theRows*theColumns )， 因 为 在 创建 ( 释放 ) 数组 时 ， 类 型 为 T 的 每 一 个 数组 元 素 的 构造 
函数 ( 析 构 函数 ) 都 要 被 调用 。 

假定 一 个 和 矩阵 复制 和 两 个 矩阵 相 加 所 需 时 间 分 别 都 是 68()， 和 那么 矩阵 复制 构 
造 函 数 和 和 矩阵 加 法 的 渐 近 复杂 度 是 O(theRows*theColumns)。 和 矩阵 乘法 的 复杂 度 是 


O(theRows*theColumns*m.theColumns)。 
练习 


13. 1 ) 图 7-4 和 矩阵 的 转 置 矩 阵 是 什么 ? 
2) 图 7-4 和 矩阵 和 其 转 置 矩阵 的 乘积 是 什么 ? 
14. 用 图 7-2b 和 矩阵 做 练习 13。 
15. 扩充 matrix 类 :增加 方法 -=( 每 个 矩阵 元 素 减 去 一 个 指定 的 值 ),<<( 输入 一 个 矩阵 ),*=( 每 
个 矩阵 元 素 乘 以 一 个 指定 的 值 )，/=。 测 试 编写 的 代码 。 
16. 扩充 matrix 类 ， 增 加 一 个 方法 tranpose()， 返 回 值 是 转 置 后 的 和 矩阵。 测试 你 的 代码 。 
17. 1 ) 开发 一 个 类 matrixAs2DArray， 用 二 维 数 组 表示 矩阵。 这 个 类 应 该 包含 所 有 矩阵 方法 和 
和 矩阵 转 置 。 
2 ) 测试 你 的 方法 。 
3 ) 针对 和 矩阵 加 法 和 乘法 的 性 能 ， 对 类 matrix 和 类 matrixAs2DArray 进行 比较 。 比 较 的 方 
法 是 测量 实际 的 运行 时 间 。 你 认为 行 主 映射 的 一 维 数组 表示 方法 比 二 维 数组 表示 方法 
好 在 哪里 ? 
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7.3 ”特殊 矩阵 
7.3.1 定义 和 应 用 
方 阵 (square matrix ) 是 行 数 和 列 数 相同 的 和 矩阵。 一些 常用 的 特殊 方 阵 如 下 : 
。 对 角 和 矩阵 ( diagonal )。M 是 一 个 对 角 和 矩 ”~ ji 
阵 ， 当 且 仅 当 i 对 j 时 ，M(i,j) = 0。 如 ee 人 
图 7-7a 和 图 7-8a 所 示 。 ee 人 
e 三 对 角 和 矩阵 (tridiagonal )。M 是 一 个 三 x ee 
xX XXX 
对 角 和 矩阵 ， 当 生 仅 当 |i-j|>1 时 ，M(i,j) = | x x x| 
0。 如 图 7-7b 和 图 7-8b 所 示 。 a) 对 角 和 矩阵 b) 三 对 角 和 矩阵 
e 下 三 角 和 矩阵 (lower triangular )。M 是 一 
个 下 三 角 和 矩阵 ， 当 且 仅 当时 ，M0z7) = 区 | x x 
0。 如 图 7-7c 和 图 7-8c 所 示 。 X XX 和 
XXXX XXXXX 
e 上 三 角 和 矩阵 (upper triangular )。M 是 一 |xxxxx Tp 
XXXXXX XXX 
个 上 三 角 和 矩阵 ， 当 上 且 仅 当 必 j 时 , Mlij)= |xxxxxxx 和 
如 图 7-7d 和 图 7-8d 所 示 Cs 
wa RE c) 下 三 角 和 矩阵 d) 上 三 角 和 矩阵 
。 对 称 和 矩阵 (symmetric)。M 是 一 个 对 x 表 示 非 0 元 素 ，0 元 素 未 给 出 
称 和 矩阵 ， 当 和 且 仅 当 对 于 所 有 的 i 和 j， 图 7-7 ”特殊 和 矩阵 的 非 0 元 素 
Mi 站 =M(j,i)。 如 图 7-8e 所 示 。 
2000 2100 2000 
0 1 00 3 3 0 = | 
0 企 进 浊 | 0 
00056 0090 4270 
a) 对 角 甜 阵 b) 三 对 角 和 矩阵 c) 下 三 角 和 矩阵 
> 站 动人 2460 
0 138 4 195 
00 16 ,0 
000 0 0370 
d) 上 三 角 乍 阵 e) 对 称 和 矩阵 


图 7-8 4x4 的 特殊 矩阵 


例 7-4 考察 佛罗里达 州 (Florida ) 的 6 个 城 
市 Gainesville 、Jacksonvillje 、Miami、Orlando， 
Tallaha--ssee 和 Tampa。 按 照 上 面 列 出 的 顺序 ， 从 
1 ~ 6 编号 。 任 意 两 个 城市 之 间 的 距离 可 以 用 一 个 
6x6 的 矩阵 distance 来 表示 。 和 抢 阵 的 第 ; 行 和 第 : 
列 代 表 第 i 个 城市 。distance(i,j) 代表 城市 上 和 城市 7 
之 间 的 距离 。 图 7-9 给 出 了 相应 的 矩阵 ， 因 为 对 于 
所 有 的 i 和 j 有 distance(i,j)=distance(j,i)， 所 以 这 是 
一 个 对 称 和 矩阵 。 国 


GN JxX M OD ITIL TITM 
GN 0 73 333 114 148 129 
JX 73 0 348 140 163 194 
MI 333 348 0 229 468 250 
OD 114 140 229 0 251 84 
TE 148 163 468 251 0 273 
T™ 129 194 250 84 273 0 

















GN = Gainesville | OD = Oriando 

JX= Jacksonville | TL= Tallahassee 

MI = Miami TM = Tampa 
距离 单位 : 千 米 


图 7-9 ”distance 矩阵 
(来 源 : Rand McNally Road Atlas ) 








例 7-5 假定 一 个 楼 有 nn 个 纸 盒 ， 纸 盒 1 位 于 栈 底 ， 纸 盒 了 位 于 栈 顶 。 每 个 纸 盒 的 宽度 
为 w， 深 度 为 4。 第 个 纸 盒 的 高 度 为 hi。 栈 的 体积 为 w* dv 六 。 在 栈 折 双 (stack folding ) 
问题 中 ， 我 们 要 选择 一 个 折 双 点 i， 把 栈 分 成 两 个 相 邻 的 子 栈 ， 其 中 一 个 子 栈 包 含 纸 盒 1 至 i， 
另 一 个 子 栈 包 含 纸 盒 二 1 至 n。 重 复 这 种 折 著 过 程 ， 可 以 得 到 若干 个 子 栈 。 如 果 生 成 了 s 个子 
栈 ， 则 这 些 子 栈 所 需要 的 空间 宽度 为 s*w， 深 度 为 4， 高 度 有 hn 为 最 高 子 栈 的 高 度 。s 个 子 栈 所 
需要 的 空间 容量 为 s+w*q*h。 由 于 hh 是 第 i 个 至 第 j 个 纸 盒 所 构成 栈 的 高 度 (其 中 i<j), 因 
此 有 的 可 能 取 值 可 由 nxn 和 矩 阵 五 给 出 ， 其 中 对 于 六 7) 有 H(i, 站 =0， 对 于 i<j 有 H(AD)= 交 hn 
由 于 每 个 纸 盒 的 高 度 可 以 认为 大 于 0， 所 以 H(i, 站 =0 代表 一 个 不 可 能 的 高 度 。 图 7-10a 给 出 了 
一 个 五 个 纸 盒 的 栈 。 每 个 矩形 中 的 数字 代表 纸 盒 的 高 度 。 图 7-10b 给 出 了 五 个 纸 盒 栈 折 又 成 
三 个 栈 后 的 情形 ， 其 中 最 大 栈 的 高 度 为 7。 符 阵 妃 是 一 个 上 三 角 和 矩阵 ， 如 图 7-10c 所 示 。 栈 
折 香 问题 的 一 个 应 用 是 栈 所 包含 的 内 容 为 电子 部 件 ， 目 的 是 折 炙 后 的 栈 所 需 空间 最 小 ( 见 本 
书 网 站 )。 























5 
2 
4 人 时 
1 [6 9131520 
3 2 |037914 
4 5 3 |00461 
6 6 4 |l00027 
3 2 5 |00005 
a) 栈 b) 3 个 栈 折 释 c) 五 矩 阵 


图 7-10 栈 折 释 


7.3.2 ”对 角 和 矩阵 


一 个 rows xrows 的 对 角 和 矩阵 D 可 以 表示 为 一 个 二 维 数组 element[rows][rows]， 其 中 
element[i-1][j-1] 表示 D(i, 站 。 这 种 表示 法 需要 rows? 个 类 型 为 T 的 数据 空间 。 然 而 ,对 角 
和 矩阵 最 多 只 有 rows 个 非 0 元素 ， 因 此 可 以 用 一 维 数 组 element[rows] 来 表示 对 角 矩 阵 ， 其 
中 element[i-1] 表示 D(i,i)。 所 有 未 在 一 维 数组 中 出 现 的 矩阵 元 素 均 为 0。 这 种 表示 法 仅 需 要 
rows 个 类 型 为 T 的 数据 空间 ， 而且 产 生 了 C++ 类 diagonalMatrix ( 见 程 序 7-8 至 程序 7-10 )。 

构造 函数 的 时 间 复 杂 度 ， 当 工 是 内 部 类 型 时 为 0(1)， 当 T 是 用 户 定义 类 型 时 为 O(rows)。 
方法 get 和 set 的 时 间 复 杂 度 为 @(1)。 


程序 7-8 类 diagonalMatrix 的 声明 和 构造 函数 


template<class T> 
class diagonalMatrix 
{ 


public: 
diagonalMatrix(int theN = 10); 
~diagonalMatrix() {delete [] element;} 


T get(inty int) const; 
void set(int, int, const T&); 
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private: 
int n; 1/ 和 矩阵 维 数 
T *element; /存储 对 角 和 矩阵 的 一 维 数组 


1z 


template<class T> 
diagonalMatrix<T>::diagonalMatrix(int theN) 
{1/ 构造 函数 
// 检验 theN 的 值 是 否 有 效 
dE (EEN < 1) 
throw illegalParameterValue ("Matrix size must be > 0"); 


n= theN; 
element = new T [nj]; 


程序 7-9 类 diagonalMatrix 的 方法 get 


template <class T> 
T diagonalMatrix<T>::get (int i, int j) const 
{1/ 返回 矩阵 中 (i,j) 位 置 上 的 元 素 
// 检验 i 和 j 的 值 是 否 有 效 
和 性 区 于 人 和 车 二 生字 定 | 耻 守 
throw matrixIndexOutOfBounds (); 


if (i == j) 

return element [i-1]; 1/ 对 角 线 上 的 元 素 
else 

return 0; 1/ 非 对 角 线 上 的 元 素 


程序 7-10 类 diagonalMatrix 的 方法 set 





template<class TS 
void diagonalMatrix<T>::set (int i, int j, const Tg& newValue) 
{1/ 存储 (i,j) 项 的 新 值 
1/ 检查 1 和 j 的 值 是 否 有 效 
i 
throw matrixIndexOutOfBounds (); 


jE 1 
1/ 存储 对 角 元 素 的 值 

element[i-1] = newValue; 
else 

1/ 非 对 角 元 素 的 值 必须 是 0 

if (newValue != 0) 

throw illegalParameterValue 
("nondiagonal elements must be zero");}; 


7.3.3 ”三 对 角 和 矩阵 


在 一 个 rows x rows 的 三 对 角 和 矩阵 中 ， 非 0 元素 排列 在 如 下 三 条 对 角 线 上 : 
1 ) 主 对 角 线 





Lo 
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2 ) 主 对 角 线 之 下 的 对 角 线 ( 称 低 对 角 线 ) i=jtl。 
3 ) 主 对 角 线 之 上 的 对 角 线 ( 称 高 对 角 线 ) i=j-1o 





这 三 条 对 角 线 上 的 元 素 总 数 为 3*rows-2。 可 以 用 一 个 容量 为 3*rows-2 的 一 维 数 
组 element 来 描述 三 对 角 和 矩阵 ， 因 为 只 有 三 条 对 角 线 上 的 元 素 需 要 真正 地 存储 。 考 察 
图 7-8b 的 4x4 三 对 角 和 矩阵 。 三 条 对 角 线 上 共有 10 个 元 素 。 如 果 逐 行 映 射 ， 则 element[0:9]= 


[2,1,3,1,3,5,2,7,9,0] ; 如果 逐 列 映射 ， 则 有 element=[2,3,1,1,5,3,2,9,7,0] ; 如 果 从 最 下 面 的 
对 角 线 开始 逐条 对 角 线 映射 ， 则 有 clement=[3,5,9,2,1,2,0,1,3,7]。 如 上 所 述 ， 把 三 对 角 和 矩阵 


映射 到 数组 element 有 三 种 不 同方 式 。 每 一 种 方式 都 有 不 同 的 get 和 set 函数 代码 。 假 定 类 
tridiagonalMatrix 采用 的 是 逐条 对 角 线 映射 。 数 据 成 员 和 构造 函数 与 类 diagonal 的 相似 。 程 序 
7-11 是 get 函数 的 代码 ， 而 set 函数 的 与 之 相似 ， 可 以 从 本 书 网 站 上 得 到 。 


程序 7-11 三 对 角 和 矩阵 的 方法 get 





template <class T> 
T tridiagonalMatrix<T>::get (int i, int j) const 


{/ 返回 矩阵 中 (i,j) 位 置 上 的 元 素 


1 检验 并 和 j 的 值 是 否 有 效 
EE 
throw matrixIndexOutOfBounds () ; 


// 殉 定 要 返回 的 元 素 
switeh ( 主 = 了 ) 
{ 
case 1: /下 对 角 线 
return element [1 - 2]; 
case 0: 1/ 主 对 角 线 
return element[n + i - 2]; 
case -1: 1// 上 对 角 线 
return element[2 * n+i- 2]; 
default: return 0; 


} 

练习 25 是 三 对 角 和 矩阵 的 另 一 种 节省 空间 的 表示 方法 ， 它 使 用 了 不 规则 和 矩阵 ( 见 7.1.6 节 )。 
7.3.4 三 角 和 矩阵 

在 一 个 n 行 的 下 三 角 和 矩阵 中 ( 见 图 7-7c )， 非 0 区域 的 第 一 行 有 1 个 元 素 ， 第 二 行 有 2 个 
元 素 ，…, 第 n 行 及 个 元 素 。 在 一 个 上 三 角 和 矩 阵 中 ， 非 0 区 域 的 第 一 行 有 nn 个 元 素 , 第 二 
行 有 n-l 个 元 素 ，…， 第 n 行 有 1 个 元 素 。 这 两 种 三 角形 非 0 区 域 共 有 非 0 元素 : 

pe =n(n+1)/2 

这 两 种 三 角 和 矩阵 都 可 以 用 一 个 大 小 为 n(n+1)/2 的 一 维 数组 来 表示 。 考 察 一 个 下 三 角 
矩阵 卫 ， 它 被 映射 到 一 维 数组 element。 可 以 按 行 映射 也 可 以 按 列 映射 。 图 7-8c 的 4x4 
下 三 角 和 矩阵 ， 按 行 映 射 的 结果 是 element[0:9]=[2.$,1.0,3,1,4,2,7,.0]， 按 列 喘 射 的 结果 是 
element=[2,5,0,4,1,3,2,1,7,0]。 

考察 一 个 下 三 角 和 矩阵 的 元 素 L(i, 站 。 如 果 i， 则 L5G, 站 =0 ; 如 果 i 三 j， 则 LGi, 让 位 于 非 0 
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区 域 。 在 按 行 映射 方式 中 ， 在 元 素 LN] (1 > 7 ) 之 前 分 别 有 分 个 元 素 位 于 第 1 行 至 第 二 1 
行 的 非 0 区 域 和 j-1 个 元 素 位 于 第 1 行 的 非 0 区域 ， 共 有 i(i-1)2+j-1 个 。 这 个 表达 式 同时 给 
出 了 元 素 L(i,j) 在 数组 element 中 的 位 置 。 利 用 这 个 表达 式 ， 得 到 在 程序 7-12 给 出 的 set 方 


法 ， 方 法 get 与 之 类 似 。 二 者 的 时 间 复 杂 度 均 为 8(1)， 
练习 26 是 三 角 和 矩阵 的 另 一 种 节省 空间 的 表示 方法 ， 它 使 用 了 不 规则 抢 阵 ( 见 7.1.6 节 )。 


程序 7-12 方法 lowerTriangularMatrix<T>::set 





template<class T> 
void lowerTriangularMatrix<T>::set(int i, int j, const T& newValue) 
{1/ 给 (i,j) 元 素 赋 新 值 
/检验 和 j 的 信 是 否 合 法 
| 
throw matrixIndexOutOfBounds (); 


人 (各 ;3 引 ) 丁 下 三 背 ， 当 县 棋 当 和 3= 池 
由 生生 芳 = 让 


element[i * (i - 1) /2+j- 1] = newvalue; 
else 
if (newValue != 0) 


throw illegalParameterValue 
("elements not in lower triangle must be zero"); 


7.3.5 ”对称 矩 阵 


一 个 nxn 对 称 和 矩阵 ， 可 以 视 为 下 三 角 或 上 三 角 和 矩阵 ， 用 三 角 和 矩 阵 的 表示 方法 ， 用 一 个 大 
小 为 n(n+1)/2 的 一 维 数组 来 表示 。 未 存储 的 元 素 可 以 用 存储 的 元 素来 计算 。 


练习 
18. 在 夏 日 ， 坐 着 内 胎 ， 上 千 人 一 起 沿 沉睡 河 顺 流 而 下 ， 是 一 项 令 人 开心 的 体验 。 沉 睡 河 有 7 
个 地 点 可 以 出 入 。 我 们 按照 从 上 游 到 下 游 的 顺序 ， 拒 它们 依 此 编号 1 到 7。 每 一 个 地 点 都 


有 不 同 的 商贩 出 租 内 胎 . 在 1 号 地 点 出 租 内 胎 的 商贩 , 在 1、3、6 和 7 号 地 点 回收 内 胎 ; 
在 2 号 地 点 出 租 内 胎 的 商贩 在 3、5 和 6 号 地 点 回收 内 胎 。 在 3、4、5、6 和 7 号 地 点 出 租 
的 内 胎 ， 其 回收 地 点 分 别 为 3、5、7; 5、6、7; 7; 6、7; 7。 

1 ) 写 一 个 7x7 和 矩阵 ， 如 果 在 i 号 地 点 出 租 内 胎 ， 在 j 号 地 点 回收 内 胎 ， 则 (i, ) 项 为 1， 
否则 (ij ) 项 为 0。 这 个 矩阵 是 对 称 的 吗 ” 是 否 为 上 三 角 ? 是 否 为 下 三 角 ? 

2 ) 写 一 个 7x7 矩阵， 如 果 在 j 号 地 点 出 租 内 胎 , 在 i 号 地 点 回收 内 胎 ， 则 (ij ) 项 为 1， 
否则 (i,j ) 项 为 0。 这 个 矩阵 是 对 称 的 吗 ? 是 否 为 上 三 角 ? 是否 为 下 三 角 ? 

3 ) 按照 从 下 游 到 上 游 的 顺序 重新 为 出 人 地 点 编号 。 然 后 写 一 个 7x7 矩阵， 如 果 在 i 号 地 
点 出 租 内 胎 , 在 7 号 地 点 回收 内 胎 ， 则 (i,j ) 项 为 1， 否 则 (i,j ) 项 为 0。 这 个 矩阵 是 
对 称 的 吗 ? 上 三 角 的 吗 ? 下 三 角 的 吗 ? 

19. 一 排 有 5 个 间距 相等 的 狗 窜 。 每 一 个 狗 窜 有 一 只 狗 ， 而且 被 链条 挫 在 狗 窝 的 柱子 上 ， 每 一 

根 链条 长 度 等 于 相 邻 两 个 狗 窜 的 距离 。 假 定 第 i 只 狗 被 挫 在 第 i 个 狗 窒 。 


20. 


2] 


22: 


23. 


24. 
2% 


26: 


27. 


28. 


29: 


30. 


31 





1) 第 3 只 狗 可 以 走 到 哪 一 个 狗 窜 ? 

2 ) 写 一 个 5x5 矩阵 ， 当 第 只 狗 可 以 走 到 第 /7 个 狗 窝 时， 元 素 (i,)) 的 值 为 1， 否则 为 0。 

3 ) 这 个 和 矩 阵 是 哪 一 种 特殊 矩 了 泗 ， 对 称 和 矩阵 、 上 三 角 和 矩阵 、 下 三 角 和 矩 了 泗 、 三 对 角 和 矩 阵 或 对 
角 和 矩阵 ? 

1 ) 扩充 diagonalMatrix 类 ( 见 程序 7-8 )， 增 加 以 下 成 员 方法 : 输入 、 输 出 、 加 、 减 、 乘 
和 年 阵 转 置 。 每 个 成 员 方 法 的 结果 都 是 一 个 用 一 维 数组 表示 的 对 角 和 矩阵 。 

2 ) 测试 代码 。 

3 ) 每 个 成 员 方法 的 时 间 复 杂 度 是 多 少 ? 

1 ) 扩充 tridiagonalMatrix 类 ( 见 程序 7-11 )， 增 加 以 下 成 员 方 法 : 输入 、 输 出 、 加 、 减 、 
乘 和 矩阵 转 置 。 

2 ) 测试 代码 。 

3 ) 每 个 成 员 方 法 的 时 间 复 杂 度 是 多 少 ? 

1 ) 开发 一 个 C++ 类 tridiagonalByColumns， 它 按 列 顺序 把 nxn 三 对 角 和 矩阵 映射 为 长 度 为 
3n-2 的 一 维 数组 。 包 含 如 下 方法 : 输入 、 输 出 、 取 值 、 存 值 、 加 、 减 和 矩阵 转 置 。 

2 ) 测试 代码 。 

3 ) 每 个 方法 的 时 间 复 杂 度 是 多 少 ? 

开发 一 个 C++ 类 tridiagonalByRows， 它 按 行 顺序 把 nxn 三 对 角 和 矩阵 映射 为 长 度 为 3n-2 

的 一 维 数组 。 其 余 的 要 求 同 练习 22。 

两 个 三 对 角 和 矩阵 的 乘积 仍然 是 一 个 三 对 角 和 矩阵 吗 ? 

编写 一 个 类 tridiagonalAsIrregularArray， 它 用 二 维 数组 element 表示 一 个 xz 的 三 对 角 拢 

阵 ， 数 组 element 的 第 0 行 和 第 n-1 行 有 两 个 位 置 ， 其余 的 行 有 三 个 位 置 。 参 考 7.1.6 节 

来 创建 这 个 二 维 数组 。 这 个 类 应 该 包含 类 tridiagonalMatrix 的 所 有 方法 。 

1 ) 测试 代码 。 

2 ) 类 tridiagonalMatrix 和 类 tridiagonalAslrregularArray 各 自 的 优点 是 什么 。 

编写 一 个 类 lowerTriangleAslrregularArray， 用 二 维 数 组 表示 一 个 nxn 的 下 三 角 和 矩阵 ， 数 

组 element 的 第 i 行 有 i 个 位 置 。 参 考 7.1.6 节 来 创建 这 个 二 维 数组 。 这 个 类 应 该 包含 类 

lowerTriangularMatrix 的 所 有 方法 。 

1 ) 测试 代码 。 

2 ) 类 lowerTriangularMatrix 和 类 lowerTriangleAsIrregularArray 各 自 的 优点 是 什么 。 

模仿 程序 7-12， 为 上 三 角 和 矩阵 编写 C++ 类 upperTriangularMatrix。 包 含 构造 、 取 值 get 和 

存 值 set 方法 。 

扩充 类 lowerTriangularMatrix， 增 加 以 下 方法 : 输入 、 输 出、 加 和 减 。 确 定 方 法 的 时 间 复 

杂 度 。 

扩充 类 lowerTriangularMatrix， 增 加 矩阵 转 置 方法 ， 返 回 值 是 下 三 角 和 抢 阵 的 转 置 矩阵 ， 是 

上 三 角 和 矩阵 ， 是 类 upperTriangularMatrix 的 一 个 实例 。 确 定时 间 复 杂 度 。 

令 4 和 B 是 两 个 nxn 的 下 三 角 和 矩阵 。 它 们 在 非 0 区 域 的 元 素 总 个 数 是 n(n+1)。 设 计 一 个 

映射 方式 ， 用 element[n+1][n] 来 表示 这 两 个 矩阵 。( 提示 : 把 下 三 角 和 矩阵 4 和 上 三 角 和 矩阵 

B" 合并， 得 到 一 个 (n+1) xz 的 矩阵 。) 分 别 为 矩阵 4 和 B 编写 取 值 和 存 值 函数 。 时 间 复 

杂 度 应 该 是 @(1)。 

. 编写 一 个 方法 ， 实 现 两 个 下 三 角 和 矩阵 的 乘法 ， 作 为 类 lowerTriangularMatrix 的 成 员 ( 见 程 
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34. 


35. 


30. 


Ss 


贫 7 茧 发 绍 和 征 序 。 163 





序 7-12 )。 结 果 用 一 个 二 维 数组 表示 。 确 定 方法 的 时 间 复 杂 度 。 


. 编写 一 个 方法 ， 实 现 一 个 下 三 角 和 矩阵 和 一 个 上 三 角 矩 阵 的 乘法 ， 这 两 个 矩阵 都 是 按 行 的 方 


式 存 储 在 一 维 数 组 中 。 结 果 和 矩阵 用 二 维 数组 表示 。 方 法 的 时 间 复 杂 度 是 什么 ? 


. 假定 按 行 的 方式 把 对 称 和 矩阵 的 下 三 角 区 域 存储 在 一 个 一 维 数 组 中 。 设 计 一 个 C++ 类 


lowerSymmetricMatrix， 包 含 取 值 和 存 值 方法 .这 两 个 方法 的 时 间 复 杂 度 应 为 9(1)。 


一 个 mx 的 C 形 和 矩阵 是 除 第 1 行 、 第 ” 行 和 第 1 列 以 外 的 元 素 都 是 0 的 矩阵 ( 见 
图 7-11 )。 它 的 非 0 元 素 最 多 有 3n-2 个 。 一 个 C 形 和 矩阵 可 以 压 XXXXXXX 
缩 存储 在 一 个 一 维 数组 ， 只 存储 第 1 行 、 第 行 和 第 1 列 剩余 
的 元 素 。 * 
1 ) 给 出 一 个 4x4 的 C 形 矩阵 和 它 的 压缩 表示 方式 。 XXXXXX¥ 

2 示 一 个 互 0 元 素 ， 
2 ) 证 明 一 个 nxn 的 C 形 和 矩阵 最 多 有 3n-2 个 非 0 元素。 项 表示 0 元 素 


3 ) 设计 一 个 类 cMatrix， 用 上 述 的 一 维 数 组 表示 nxn 的 C 形 
抢 阵 。 包 含 构造 、 取 值 和 存 值 方法 。 

一 个 mxz 的 矩阵 M 称 为 反对 角 和 矩阵 (antidiagonal )， 当 上 且 仅 当 itj 关 ntl 时 ， 元 素 

MU PD=0。 

1 ) 给 出 一 个 4x4 的 反对 角 和 矩阵 的 例子 。 

2 ) 证 明 nxn 的 反对 角 和 矩 阵 M 最 多 有 个 非 0 元 素 。 

3 ) 设法 用 长 度 为 n 的 一 维 数组 表示 一 个 nxn 的 反对 角 和 矩阵 。 

4 ) 用 3 ) 的 表示 方式 设计 C++ 类 antidiagonalMatrix， 包 含 取 值 和 存 值 方法 。 

5 ) 取 值 和 存 值 方法 的 时 间 复 杂 度 是 什么 ? 

6 ) 测试 代码 。 

一 个 mx 的 矩阵 了 称 为 等 对 角 和 矩阵 ( Toeplitz matrix )， 当 且 仅 当 产 1 和 户 1 时 ，7(,])= 

py, 

1 ) 证 明 一 个 nxn 的 等 对 角 和 矩阵 最 多 有 2n-1 个 不 同 的 元 素 。 

2 ) 设计 一 个 映射 ,把 一 个 等 对 角 和 矩阵 映射 到 一 个 长 度 为 2n-1 的 一 维 数组 。 

3 ) 采用 2) 的 映射 模式 设计 一 个 C++ 类 toeplitzMatrix， 用 一 个 大 小 为 2n-1 的 一 维 数组 
来 存储 等 对 角 和 矩阵 。 包 含 get 和 set 方法 。 这 两 个 方法 的 时 间 复 杂 度 应 为 6(1)。 

4) 编写 一 个 成 员 方法 ， 实 现 以 2 ) 方式 存储 的 两 个 等 对 角 和 矩阵 的 乘法 ， 结 果 存 储 在 一 个 
二 维 数组 。 确 定时 间 复 杂 度 。 

一 个 带 状 方 阵 (square band matrix ) D,;s 是 一 个 nxn 矩阵， 所 以 非 0 元素 都 处 于 以 主 对 

角 线 为 中 心 的 一 个 带 状 区 域 中 。 这 个 带 状 区 域 包括 主 对 角 线 和 主 对 角 线 上 下 的 a-1 条 对 角 

线 ， 如 图 7-12 所 示 。 

1 ) 带 状 矩 阵 D,。 有 多 少 个 元 素 ? 

2 ) 对 D,, 的 带 状 区 域 中 的 元 素 dv 来 说 ，i 和 jj 之 间 有 什么 关系 ? 

3 ) 假定 从 最 下 面 的 一 条 对 角 线 开始 ， 沿 角 线 把 D; ,的 带 状 区 域 映 射 到 一 个 一 维 数组 b 
中 。 图 7-13 用 这 种 方式 表示 了 图 7-12 的 带 状 方 阵 D43。 
给 出 一 个 公式 ， 用 来 计算 带 状 区 下 方 元 素 4;; 的 存储 位 置 (在 上 例 中 wo 的 位 置 为 2， 
即 location(di0)=2 )。 

4) 使 用 3) 的 映射 方法 设计 一 个 C++ 类 squareBandMatrix， 包 含 get 和 set 方法 。 这 两 个 
方法 的 时 间 复 杂 度 分 别 是 多 少 ? 测试 你 的 代码 。 


图 7-11 一 个 C 形 和 矩阵 
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5 ) 设计 一 个 类 squareBandAsIrregularArray， 存 储 空间 是 二 维 数组 element， 每 一 行 的 长 度 
是 该 行 带 状 区 域 的 长 度 。 例 如 ，element [ 0 ] 是 一 个 一 维 数组 ， 有 a 个 位 置 。 该 类 包 
含 get 和 set 方法 。 每 个 方法 的 时 间 复 杂 度 是 什么 ? 测试 你 的 代码 。 











6) 对 4) 和 5) 的 表示 方法 ， 比 较 优 缺点 。 
a 对 角 线 
上 带 状 区 域 
及 
0 
下 带 状 _ 
区 域 7 行 
0 
Dass 
主 对 角 线 
Dn.a 
图 7-12 带 状 方 阵 
bio) bm bl2] bl3] bo bg bb b7 ba bo9j bllol bo bn blal 
9 7 3 号 6 6 0 2 be] rd 4 9 8 级 


dd20 dal dio 21 da2 too dii td22 da3 do1 di da toa di3 


7-13 图 7-12 方 阵 D4,3 的 描述 


7.4 稀疏 矩阵 
7.4.1 基本 概念 


一 个 m xn 的 矩阵， 如 果 大 多 数 元 素 都 是 0， 则 称 为 稀 足 矩阵 ( spare matrix )。 一 个 矩阵 
如 果 不 是 稀疏 的 ， 就 称 为 稠密 和 矩阵 ( dense matrix )。 在 稀 朴 矩阵 和 稠密 矩阵 之 间 没 有 明确 的 界 
限 。n xz 的 对 角 和 矩阵 和 三 对 角 和 矩阵 是 稀 玖 和 矩阵。 它们 的 非 0 元素 是 O(n)，0 元 素 是 0(m)。 一 
个 nxn 的 三 角 和 矩阵 是 稀 玖 矩阵 吗 ?” 它 至 少 有 n(n-1)/2 个 0 元 素 , 最 多 有 n(nt+1)/2 个 非 0 元 
素 。 本 节 规 定 ， 稀 玻 和 矩阵 的 非 0 元 素 个 数 要 小 于 nw/3， 有 时 还 要 小 于 nY5， 因 此 三 角 和 矩 阵 被 视 

诸如 对 角 和 矩阵 和 三 对 角 和 矩 阵 这 样 的 稀 政 矩阵， 其 非 0 区 域 的 结构 很 有 规律 ， 因 此 可 以 设 
计 一 个 很 简单 的 存储 结构 ， 其 大 小 就 等 于 矩阵 非 0 区 域 的 大 小 。 本 节 中 主要 考察 非 0 区 域 不 
规则 的 稀 玖 和 矩阵。 

例 7-6 某 超级 市 场 正 在 开展 一 项 关于 顾客 购物 品种 的 综合 研究 。 为 此 收集 了 1000 个 
顾客 的 购物 数据 ， 这 些 数据 被 组 织 成 一 个 矩阵 purchases， 其 中 purchases(i, 站 表示 顾客 /所 
购买 的 商品 ;的 数量 。 假 定 该 超级 市 场 有 10 000 种 不 同 的 商品 ， 那 么 purchases 将 是 一 个 
10 000 x 1000 的 矩阵。 如 果 每 个 顾客 平均 购买 了 20 种 不 同 的 商品 ， 那 么 在 10 000 000 个 和 矩阵 
元 素 中 大 约 只 有 20 000 个 元 素 为 非 0， 并 且 非 0 元 素 的 分 布 没有 很 明确 的 规律 。 

超级 市 场 有 一 个 10000x1 的 价格 矩阵 price，priceD 代表 商品 ;的 单价 。 矩阵 
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spent=purchases'*price 是 一 个 1000 x 1 的 矩阵 ， 它 给 出 每 个 顾客 所 花费 的 购物 资金 。 如 果 用 
一 个 二 维 数组 来 描述 矩阵 purchases， 那 么 将 浪费 大 量 的 存储 空间 ， 并 且 计 算 spent 时 也 将 耗 
费 很 多 不 必要 的 时 间 。 图 


7.4.2 ”用 单个 线性 表 描 述 


可 以 按 行 主 次 序 把 无 规则 稀 玖 和 矩阵 的 非 0 元 素 映 射 到 一 个 线性 表 中 。 例 如 图 7-14a 的 
4x8 和 抢 阵 按 行 主 次 序 排列 为 : 2,，1,， 6. 7, 3, 9, 8, 4,，5。 

为 了 重建 矩 阵 结构 ， 必 须 记 录 每 个 非 0 元素 的 行 号 和 列 号 ， 因 此 数组 元 素 需 要 三 个 域 : 
row ( 矩阵 元 素 所 在 行 )、col ( 矩阵 元 素 所 在 列 ) 和 value ( 矩阵 元 素 的 值 )。 为 此 ， 定 义 结构 
matrixTerm， 使 其 具有 三 个 数据 成 员 : 整 击 row 和 col，T 类 型 value。 

图 7-14a 的 稀 下 和 矩阵 非 0 元 素 ， 按 行 主 次 序 存 储 在 图 7-14b 的 线性 表 terms 中 。 带 有 
terms 标签 的 一 行 是 矩阵 非 0 元 素 在 线性 表 中 的 索引 ; 线性 表 元 素 不 仅 存 储 和 矩阵 非 0 元 素 ， 还 
要 存储 它 在 矩阵 中 的 行 号 和 列 号 。 





O00020010 terms |0 1 2 3 4 5 6 7 8 

06007003 row |l 12223344 

00090800 eol |4 72584623 

04500000 value |2 1 6739845 
a) 一 个 4 x 8 矩阵 b) 线性 表 描 述 


图 7-14 一 个 稀 哮 矩阵 和 线性 表 描 述 


假定 线性 表 terms 是 类 arrayList 的 一 个 实例 。 如 果 图 7-14a 的 9 个 非 0 元 素 都 按 整 型 
存储 ， 那 么 线性 表 描 述 需 要 的 空间 是 8 ( 存储 行 数 和 列 数 ) +9*12 ( 每 个 非 0 元 素 需 要 存储 
行 、 列 和 值 ， 每 一 个 需要 4 字 节 ) +8 ( 存储 线性 表 terms 的 元 素 个 数 和 容量 ) +4 ( 数组 terms. 
elements 的 引用 ) =128 字 节 。 如 果 用 一 个 4x8 的 二 维 数组 theArray 来 表示 这 个 稀 玖 矩阵， 那 
么 需要 空间 32*4( 数组 元 素 )+4*4( theArray[] 中 的 指针 )+4( 数组 theArray 的 引用 )=148 字 节 。 
在 这 个 例子 中 ,使 用 线性 表 没 有 节省 很 多 空间 。 人 然而 ， 对 例 7-6 的 和 矩阵 purchase， 线 性 表 所 
需 空间 大 约 是 20 000*12=240 000 字 节 ， 而 二 维 数组 大 约 需要 10 000 000*4=40 000 000 字 节 。 
节省 了 大 约 39 760 000 字 节 。 节 省 了 初始 化 二 维 数组 的 时 间 。 

稀 玲 和 矩阵 的 线性 表 描 述 并 没有 提高 get 和 set 函数 的 执行 效率 。 如 果 折 半 查 找 ， 那 么 get 
函数 的 执行 时 间 是 O(log[ 非 0 元 素 个 数 ])。 因 为 需要 移动 元 素 ， 所 以 set 函数 的 执行 时 间 是 
O ( 非 0 元 素 个 数 )。 如 果 采 用 链表 ， 那 么 两 个 函数 的 执行 时 间 都 是 O( 非 0 元 素 个 数 )。 如 果 
采用 标准 的 二 维 数 组 来 描述 矩阵 ， 这 两 种 函数 所 需要 的 时 间 均 为 9(1)。 不 过 ,使 用 线性 表 ， 
诸如 转 置 、 加 法 和 乘法 的 矩阵 操作 都 可 以 提高 效率 。 

1. 类 sparseMatrix 

基于 6.1.6 节 的 实验 .我们 给 terms 所 属 的 类 arrayList 添加 如 下 方法 : 

1 ) reSet(newSize) 把 数组 的 元 素 个 数 改 为 newSize， 必 要 时 增 大 数组 容量 。 

2 ) set(theIndex, theElement) 使 元 素 theElement 成 为 表 中 索引 为 theIndex 的 元 素 。 

3 ) clear() 使 表 的 元 素 个 数 为 0。 

程序 7-13 是 类 spareMatrix 的 头 ， 它 用 行 主 次 序 把 稀 朴 矩阵 映射 到 arrayList。 注 意 ， 这 
个 类 的 唯一 构造 函数 是 缺 省 构造 函数 。 
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程序 7-13 ”类 spareMatrix 的 头 


template<class T> 
class sparseMatrix 
{ 
Public: 
void transpose (sparseMatrix<T> &b); 
void add(sparseMatrix<T> &b, sparseMatrix<T> &c); 
private: 
int rows, 1/ 矩阵 行 数 
cols; 1// 矩阵 列 数 
arrayList<matrixTerm<T> > terms; // 非 0 项 表 
}; 





程序 7-14 是 重 载 输出 操作 符 << 的 代码 。 注 意 ， 这 个 代码 对 类 arrayList 的 元 素 使 用 了 从 
左 至 右 的 顺序 迭代 器 ， 按 行 主 次 序 提取 和 矩阵 非 0 元 素 ， 一 行 输出 一 个 矩阵 项 。 


程序 7-14” 重 载 输出 操作 符 << 


template <class T> 
Ostream& operator<<(ostream& out, sparseMatrix<T>& x) 


{1/ 将 x 放 入 输出 流 
/ 输出 矩阵 特征 
Out << "rows = " << X.rOWS << " columns = " 
< KACOLS ‘<< endl; 
Out << "nonzero terms = " << x.terms.size() << endl; 


1/ 输出 矩阵 项 ， 一 行 一 个 
for (arrayList<matrixTerm<T> >::iterator i = x.terms.begin(); 
i != x.terms.end(); i++) 
at < MA 4 (WH) ,LOW < MY Ke (Ri) G0 
<< ") =" << (*i).value << endl; 


return out; 


程序 7-15 的 代码 是 按 行 主 次 序 输入 稀 玖 矩阵 元 素 ， 建 立 内 部 的 表示 。 练 习 42 是 对 这 个 
代码 进行 的 改进 。 


程序 7-15 重 载 输入 操作 符 >> 


template<class T> 
istream& operator>> (istream& in sparseMatrix<T>& x) 


{V 输入 一 个 稀 政 矩阵 


1// 输 入 矩阵 特征 

int numberOfTerms; 

cout << "Enter number of rows, columns, and #terms" 
<< endl; 

in >> x.rows >> x.cols >> numberOfTerms; 


// 这 里 应 该 检验 输入 的 合法 性 ， 留 作 练 习 


1/ 设 置 x.terms 的 大 小 ， 确 保 足 够 的 容量 


x.terms.reSet (numberOfTerms); 
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// 输入 项 
matrixTerm<T> mTerm; 
for (int i = 0; i < numberOfTerms; i++) 


{ 
cout << "Enter row, column, and value of term " 
<< (II + 1) << endl;? 
in >> mTerm.row >> mTerm.col >> mTerm.value; 


// 这 里 应 该 检验 输入 的 合法 性 ， 留 作 练 习 


x.terms.set (i, mTerm); 


} 


return in; 


} 





2. 矩阵 转 置 

程序 7-16 是 矩阵 转 置 方法 transpose。 转 置 后 的 矩阵 存储 在 矩阵 b 中 。 首 先 设 置 b 的 行 
数 和 列 数 ， 然 后 使 线性 表 b.terms 的 元 素 个 数 等 于 被 转 置 矩 阵 的 元 素 个 数 。 尽 管 这 时 的 线性 
表 b.terms 还 没有 元 素 ， 但 还 是 要 令 它 的 元 素 个 数 等 于 它 最 后 将 具有 的 元 素 个 数 。 这 一 步 是 
必要 的 ， 这 样 就 可 以 使 用 方法 arrayList<T>::set 把 转 置 后 的 矩阵 元 素 存储 到 线性 表 b.terms 的 
任意 相应 的 位 置 。 否 则 ， 就 要 借助 插入 操作 ， 每 插入 一 个 元 素 ， 增 加 一 次 线性 表 的 元 素 个 数 。 
可 是 ， 当 我 们 转 置 一 个 稀世 和 矩阵 时 ， 原 来 的 第 0 个 元 素 可 能 成 为 转 置 后 的 第 6 个 元 素 ( 比如 
说 )， 而 除非 线性 表 的 元 素 个 数 是 6 或 更 多 ， 和 否则 我 们 是 不 能 把 一 个 元 素 搬 到 第 6 个 位 置 上 去 
的 。 因 此 ， 我 们 实质 上 是 把 线性 表 作 为 一 个 一 维 数组 ， 一 开始 的 元 素 个 数 等 于 它 最 终 的 元 素 
个 数 ， 然 后 通过 方法 set 给 任 一 个 位 置 赋 一 个 新 值 。 

接 下 来 是 创建 两 个 数组 colSize 和 rowNext。colSize[i] 是 输入 矩阵 *this 在 第 i 列 的 非 0 
元 素 个 数 ，rowNext[i] 是 转 置 矩阵 第 i 行 首 个 非 0 元 素 在 b 中 的 索引 。 例 如 ， 对 图 7-14a 的 稀 
玖 矩阵 ，colSize[1:8]=[0,2,1,2,1,1,1,1]。rowNext[1:8]=[0,0,2,3,5,6,7,8]。 

对 colSize 的 计算 在 前 两 个 for 循环 中 完成 : 使 用 迭代 器 ， 检 查 每 个 输入 矩阵 元 素 。 对 
rowNext 的 计算 在 第 三 个 for 循环 中 完成 : rowNext[j] 的 值 是 转 置 矩 阵 b 的 第 0 行 至 第 i-1 行 
的 元 素 个 数 ， 即 输入 矩阵 *this 的 第 0 列 至 第 i-1 列 的 元 素 个 数 。 在 最 后 一 个 for 循环 中 ， 非 
0 元 素 被 复制 到 b 中 相应 位 置 。 


程序 7-16 ” 稀 朴 矩阵 的 转 置 


template<class T> 
void sparseMatrix<T>:;:transpose (sparseMatrix<T> &b) 


{// 返回 b 中 *this 的 转 置 


// 设置 转 置 矩 阵 特征 
b.cols = rows; 
b.rows = cols; 


b.terms.reSet (terms.size()); 


/ 初始 化 以 实现 转 置 
int* colSize = new int[cols + 1]; 
int* rowNext = new int[cols + 1]; 


1// 寻找 *this 中 每 一 列 的 项 的 数目 
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es5 i114) 1/ 初始 化 
colSizelil] = 0; 
for (arrayList<matrixTerm<T> >::iterator 1 = terms.begin(); 


i != terms.end(); i++) 


COlSizZe (1L) sedl ty 


/寻找 b 中 每 一 行 的 起 始点 
rowNext [1] Os 


fo (Tit i 2 


rowNext[i] = rowNextl[li - 1] + colSize([(i - 1]; 


/实施 从 *this 到 了 b 的 转 置 复制 
matrixTerm<T> mTerm; 
for (arrayList<matrixTerm<T> >::iterator i = terms.begin(); 
i != terms.end();? i++) 
{ 
int j = rowNext[ (*i) .coll++; WP 中 的 位 置 
mTerm.row = (*i).col; 
mTerm.col = (*i) .row; 
mlerm.value = (*i) .value; 
b.terms.set(j, mTerm); 


1 


与 矩阵 的 二 维 数组 表示 ( 见 程序 2-19 ) 相 比 ， 尽 管 程序 7-16 更 复杂 ， 但 是 对 于 有 很 多 
个 0 元 素 的 矩阵 来 说 ， 它 要 快 得 多 。 不 难 发 现 ， 用 线性 表 表 示 的 例 7-6 矩阵 purchases 和 六 数 
transpose， 比 用 二 维 数 组 表示 要 更 快 。transpose 的 时 间 复 杂 度 为 O(cols+terms.size())。 

3. 两 个 矩阵 相 加 

程序 7-17 计算 c=*thistb。 这 是 通过 从 左 至 右 扫描 *this 和 b 的 非 0 项 来 实现 的 。 在 扫 
描 过 程 中 使 用 了 和 抢 阵 *this 的 迭代 器 it 和 和 矩 阵 b 的 迭代 器 ib。 在 while 循环 的 每 一 次 迭代 中 ， 
需要 区 分 三 种 情况 来 处 理 ，*it 的 索引 小 于 、 等 于 、 大 于 *ib 的 索引 。 为 此 ， 可 以 比较 *it 和 
*ib 的 行 主 索引 。 其 实 可 以 更 简单 ， 把 它们 的 行 主 索引 加 上 列 数 ， 结 果 即 程序 中 的 tIndex 和 
bIndex， 然 后 进行 比较 即 可 。 

函数 add 的 while 循环 最 多 执行 次 数 是 terms.size()+b.terms.size()， 因 为 在 每 一 次 循环 过 
程 中 ， 只 可 能 执行 下 面 的 一 种 操作 : it 增 1，ib 增 1， 两 者 都 增 1。 第 一 个 for 循环 最 多 执行 
次 数 是 terms.size()， 而 第 二 个 for 循环 最 多 执行 次 数 是 O(b.terms.size())。 另 外 ， 每 个 循环 的 
每 次 循环 所 需 时 间 是 常量 。 因 此 函数 add 的 时 间 复 杂 度 为 O(terms.size()+b.terms.size())。 如 果 
用 二 维 数组 分 别 表示 矩阵 *this 和 b， 则 两 个 和 矩阵 相 加 需 耗 时 O(rows*cols)。 当 terms.size()+b. 
terms.size() 远 小 于 rows*cols 时 ， 稀 玖 和 矩 阵 的 加 法 执行 效率 将 大 大 提高 。 


程序 7-17 ”两 个 稀疏 矩阵 相 加 
template<class T> 
void SParseMatrix<T>::add(sParseMatrix<T> &b, sparseMatrix<T> &c) 
{1 计算 ce = (*this) + b 


1/ 检验 相 容 性 
if (rows != b.rows || cols != b.cols) 
throw matrixSizeMismatch (); /矩阵 不 相 容 





/ 设置 结果 超 阵 c 的 特征 
C.rows = IOWS7 
GACoLs = COLS? 
c.terms.clear(); 


iit CSLZe, 三 0F 


/定义 *this 和 hb 的 迭代 器 

arrayList<matrixTerm<T> >::iterator 
arrayList<matrixTerm<T> >::iterator 
arrayList<matrixTerm<T> >::iterator 
arrayList<matrixTerm<T> >::iterator 


1/ 遍历 *this 和 Db， 把 相关 的 项 相 加 
while (it != itEngd && ib != ipEnd) 
{ 

1/ 行 主 索引 加 上 每 一 项 的 列 数 

int tIndex = (*it) .row * cols + 
int bindex = (*ib) .row * Cols + 
if (tIndex < bIndex) 
{//b 项 在 后 

c.terms.insert (cSize++, 

a 


入 多 


] 
else {if (tIndex == bIndex) 


{1/ 两 项 同 在 一 个 位 置 


1/ 仅 当 相 加 后 不 为 0 时 加 入 cc 
if ((*it).value + 
{ 
matrixTerm<T> mTerm; 
mTerm.row = 
mTerm.col = 
mTerm.value = 


生 已 丰 中 六 
ib++? 
} 
else 
{V/ 一 项 在 后 
c.terms.insert (cSize++v 
ib++» 
} 
} 
} 
// 复制 剩余 项 
for (7 tit != itEndy t++) 
Cc.terms.insert (cSizet++, *it); 
for (; ib != ibEnd; ib++) 
CcC.terms.insert (cSize++, *ib); 


(*it) .row; 
(ECOlTS 


淄 7 竟 阁 组 和 看 奔 


it = terms.begin(); 
ib = b.terms.begin(); 
itEnd = terms.end(); 
ibEnd = b.terms.end(); 


Cl 
tuib) scGols 


(*ib) .value != 0) 


(*it) .value + (*ib) .value; 
C.terms .insert (CSize++y 


mTerm); 


*ib); 
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7.4.3 ”用 多 个 线性 表 描 述 


如 果 把 每 一 行 的 非 0 元 素 用 一 个 线性 表 存 储 ， 就 得 到 描述 稀 玻 和 矩阵 的 另 一 种 方法 。 在 本 
节 研 究 这 种 方法 时 ， 我 们 使 用 链表 。 在 练习 52 中 ， 使 用 数组 。 


1. 表示 方法 
把 每 行 的 非 0 元 素 串 接 在 一 起 ， 构 成 一 个 链表 ， 称 作 行 链表 ( row chain )， 如 图 7-15 的 
非 阴影 节点 所 示 。 


在 图 7-15 中 ,每 一 个 非 阴 影 节 点 都 代表 稀 玖 矩阵 的 一 个 非 0 元 素 。 在 行 链表 中 ， 每 一 个 
节点 有 两 个 域 : element ( 数据 域 ) 和 next ( 指针 域 )。 数 据 域 element 有 两 个 子 域 : col ( 元素 
的 列 号 )、value (元素 的 值 )。 图 7-16a 是 行 链表 的 一 个 节点 结构 。element 的 子 域 没 有 阴影 。 


firstNode 


col next col next 


[L4T5T -7TTTN] 


value 
2[6] 村 -3517]| 村 一 18131n| 
419 TE -~ 618IN 


2 4 | 二 —=| 3 5IN 
next rowChain.firstNode 

































































N = NULL 


图 7-15 图 7-14a 矩阵 的 链表 描述 








row rowChain| 
a) 非 0 项 的 节点 b) 头 节点 链表 的 节点 


图 7-16 在 稀 足 和 矩阵 的 链表 描述 中 的 节点 结构 


一 行 至 少 有 一 个 非 0 元 素 , 才 会 建立 该 行 的 行 链表 。 行 链表 的 节点 按 列 号 升序 链接 在 
一 起 。 所 有 行 链 表 ( 即 非 阴 影 链表 ) 被 另外 一 个 链表 ( 称 为 头 节点 链表 ) 收集 在 一 起 ， 如 
图 7-15 中 的 阴影 节点 所 示 。 像 行 链表 的 节点 一 样 ， 头 节点 链表 的 节点 也 有 两 个 域 : element 和 
next。element 有 两 个 子 域 : row ( 与 行 链表 对 应 的 行 号 )、rowChain ( 指向 行 链表 ，rowChain. 
firstNode 指向 行 链 表 的 第 一 个 非 阴 影 节 点 )。 头 节点 链表 的 节点 结构 如 图 7-16b 所 示 。 

头 贡 点 链表 的 节点 按 行 号 升序 的 顺序 链接 在 一 起 。 每 个 节点 可 以 被 视 为 一 个 行 链 表 的 头 
节点 。 空 的 头 节点 链表 表示 没有 非 0 元 素 的 和 矩阵。 

2. 链表 元 素 类 型 

结构 rowElement 定义 了 行 链 表 的 元 素 类 型 。 它 的 数据 成 员 有 col ( 元 素 的 行 索 引 ) 和 
value ( 元 素 的 值 )。 结 构 headerElement 定义 了 头 节点 链表 的 元 素 类 型 。 它 的 数据 域 有 row ( 行 
索引 ) 和 rowChain ( 实际 的 链表 ， 数 据 类 型 是 extendedChain )。 

3. 类 linkedMatrix 

用 图 7-15 的 表示 方法 创建 类 linkedMatrix。 图 7-15 的 行 链表 和 头 节点 链表 实际 上 都 表 
示 为 extendedChain 的 实例 ， 因 为 我 们 都 是 在 链表 的 右 端 插入 节点 ， 即 附加 节点 。 在 一 个 
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extendedChain ( 见 程 序 6-12 ) 中 ， 附 加 一 个 节点 的 时 间 是 6(1)。 而 在 程序 6-2 的 链表 chain 
中 附加 一 个 节点 的 时 间 是 @( 链表 元 素 个 数 )。 在 用 extendedChain 表示 稀 玖 矩阵 的 时 候 ， 我 们 
增加 一 个 函数 zero()。 它 使 链表 的 元 素 个 数 的 值 为 0， 但 不 删除 链表 节点 ( 它 与 函数 clear 不 
同 ，clear 不 仅 使 元 素 个 数 的 值 为 0， 而且 还 删除 所 有 链表 节点 )。 

linkedMatrix 的 数据 成 员 与 spareMatrix 的 数据 成 员 几 乎 相同 ; 不 同 之 处 是 数据 成 员 terms 
被 headerChain 取代 ， 后 者 的 类 型 是 extendedChain。 重 载 操 作 符 << 和 >> 的 代码 从 本 书 网 站 
上 获得 。 

4. 转 置 方法 linkedMatrix<T>::transpose 

关于 转 置 操作 ， 我 们 使 用 箱子 从 输入 矩阵 *this 中 收集 那些 在 结果 和 矩阵 中 位 于 同一 行 的 非 
0 元 素 。bin[i] 是 与 结果 和 矩阵 b 的 第 i 行 非 0 元 素 所 对 应 的 链表 。 在 程序 7-18 的 艇 套 while 循环 
中 ， 我 们 按照 行 主 次 序 ， 对 头 节点 链表 从 上 到 下 ， 对 行 链表 从 左 到 右 ， 逐 个 考察 矩阵 *this 的 
元 素 ， 其 中 使 用 了 头 节 点 链表 迭代 器 也 和 行 链 表 偿 代 器 ir。 把 扫描 到 的 矩阵 *this 的 每 一 个 元 
素 都 附加 到 用 于 相应 的 箱子 链表 中 。 在 for 循环 中 收集 箱子 链表 ， 生 成 头 节点 链表 ， 作 为 结果 。 

while 循环 的 时 间 是 O ( 非 0 元 素 的 个 数 )，for 循环 的 时 间 是 O(this->cols)。 因 此 总 时 间 
是 O( 非 0 元素 的 个 数 + this->cols)。 

练习 51 要 求实 现 add 函数 和 其 他 基本 函数 。 


程序 7-18 “一 个 稀 朴 矩阵 的 转 置 


template<class T> 
void linkedMatrix<T>: :transpose (linkedMatrix<T> &b) 
{1/ 将 *this 的 转 置 在 矩阵 b 中 返回 

b.headerChain.clear (); /1/ 从 b 中 删除 所 有 节点 


1/ 创建 bins 以 收集 b 的 行 
extendedChain<rowElement<T> > *bin; 
bin = new extendedChain<rowElement<T> > [cols + 1]} 


1/ 头 节 点 和 迭代 器 

extendedChain<headerElement<T> >::iterator 
ih = headerChain.begin(), 
ihEnd = headerChain.end(); 


/把 xthis 的 项 复制 到 bins 
while (ih != ihEnd) 
{1/ 检查 所 有 行 
int r = ih->row; // 行 链表 的 行 数 


// 行 链 表 和 迭代 器 
extendedChain<rowElement<T> >::iterator 
ir = ih->rowCchain.begin(), 
irEnd = ih->rowChain.end(); 


rowElement<T> x; 


/将 *this 中 行 z 中 的 项 复制 到 bb 中 的 列 工 


iGHl EE Ty 

while (ir != irEnd) 

{1/ 把 行 链表 的 一 项 复制 到 bin 
X.Value = ir->value; 


1/ x 最 终 在 转 置 矩 阵 的 行 ir->col 中 
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bin[ir->col] .push back (x); 
并 十 十 浓 1/ 行 中 的 下 一 项 


ih++y 1/ 进入 下 一 行 


1/ 设置 转 置 答 阵 的 维 数 
b.rows = cols; 
b.cols = rows; 


1/ 收集 转 置 矩 阵 的 头 链表 
headerElement<T> h; 
1// 扫描 bins 
for (nt 于 三 下 六 = GOLS3 EF 二) 
if (!bin[i] .empty()) 
{// 转 置 矩阵 的 行 i 
h.row = i} 
h.rowChain = bin[Ii]y 
b.headerCchain.push back (h); 
bin[i] .zero(); /W/ 免 于 析 构 
} 


h.rowChain.zero(); 多 和 免 于 析 构 
delete [] bin; 
} 
7.4.4 性 能 测量 


类 sparseMatrix 和 linkedMatrix 对 空间 的 需求 近似 。 然 而 对 前 者 可 以 改进 ， 减 少 33% 的 
空间 ( 见 练习 47 )， 但 是 没有 减少 运行 时 间 。 练 习 53 设计 了 另 一 种 链表 表示 方法 ， 但 是 比 


linkedMatrix 的 空间 需求 增加 了 66%。 


图 7-17 和 图 7-18 是 分 别 用 几 种 表示 方法 实现 矩阵 加 法 和 转 置 时 所 测量 到 的 运行 时 间 ， 
这 些 表示 方法 有 : 二 维 数 组 ， 如 程序 2-21 和 程序 2-19 所 示 ( 分 别 简 记 为 2DArray，2DA ) ; 
sparseMatrix ( 简 记 为 SM ) 和 linkedMatrix ( 简 记 为 LM )。 相 加 的 两 个 稀 玖 矩阵 是 500 x 500， 
一 个 有 1994 个 非 0 元 素 ， 另 一 个 有 999 个 非 0 元素 。 转 置 的 矩阵 是 500 x 500， 有 1994 个 非 


0 元 素 。 


2DArray 2.69 1.97 
spareMatrix 0.13 0.09 
linkedMatrix 1.57 


*** 没有 测量 时 间 
时 间 单 位 ; 毫秒 
图 7-17 稀 玖 矩阵 不 同 表示 方法 的 运行 时 间 图 7-18 






[i 











2DA 


00 





transpose 


LM Wi SM 


黎 疲 矩阵 的 运行 时 间 ， 以 毫秒 为 单位 
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linkedMatrix 方法 虽然 比 sparseMatrix 方法 慢 ， 但 是 比 2DArray 方法 快 。sparseMatrix 方 


法 与 2DArray 方法 比 ， 时 间 减 少 的 程度 是 显著 的 ， 和 矩阵 加 法 和 转 置 的 时 间 大 约 为 后 者 的 1/20。 


练习 


38. 


39., 


40. 


41. 


一 


42. 


43. 
44. 


45. 


46. 
47. 


48. 
49. 


1 ) 对 图 7-8 的 矩阵 ， 按 图 7-14b 做 图 。 

2 ) 对 图 7-8b 的 矩阵 实施 sparseMatrix<T>::transpose 操作 ， 画 出 操作 后 的 结果 和 矩阵 。 

3 ) 对 图 7-8b 和 图 7-8c 实施 sparseMatrix<T>::add 操作 ， 夯 出 操作 后 的 结果 和 矩 阵 。 

1 ) 假定 一 个 500 x 500 的 矩阵 有 2000 个 非 0 元素 要 存储 。 用 500 x 500 的 二 维 整 型 数组 来 
存储 需要 多 少 空间 ? 用 sparseMatrix 来 存储 需要 多 少 空间 ? 

2 ) 一 个 闵 x7 和 矩阵 要 有 多 少 个 非 0 元 素 ， 才 使 sparseMatrix 的 存储 所 需要 的 空间 超过 
m xn 二 维 数组 的 存储 所 需要 的 空间 ?可 以 假定 T 是 整 型 。 

设计 一 个 公式 ， 对 rows x cols 矩阵 ， 按 行 主 次 序 计算 元 素 (ij) 的 索引 。 为 什么 计算 index= 

行 主 索引 +cols 比 计算 行 主 索引 要 简单 ? 证 明 ， 如 果 index! 和 index; 是 两 个 矩阵 元 素 的 索 

引 ， 那么 indexi<indexz， 当 且 仅 当 在 行 主 次 序 中 第 一 个 元 素 先 于 第 二 个 元 素 。 

编写 类 sparseMatrix 的 方法 get(theRow,theColumn) 和 set(theRow,theColumn,theValue)。 方 

法 的 时 间 复 杂 度 分 别 是 多 少 ? 

细 化 程序 7-15 的 输入 代码 ， 要 求 验 证 : 元 素 是 否 按 行 主 次 序 输入 ， 每 个 元 素 的 行 号 和 列 

号 是 否 有 效 ， 每 个 输入 元 素 是 否 非 0。 

编写 类 sparseMatrix 的 复制 构造 函数 。 

假定 按 列 主 次 序 把 一 个 稀 玻 矩阵 的 非 0 元素 映射 到 一 个 arrayList ( 带 有 本 章 补 充 的 函数 )。 

1 ) 给 出 图 7-14a 的 稀缺 矩阵 的 描述 。 

2 ) 编写 get 和 set 方法 。 

3 ) get 和 set 方法 的 时 间 复 杂 度 分 别 是 多 少 ? 

编写 一 个 方法 ， 把 两 个 存储 在 一 维 数组 的 稀缺 矩阵 相 乘 。 假 定 两 个 矩阵 和 结果 惩 阵 都 是 按 

行 主 次 序 存储 。 

按照 列 主 映 射 来 做 练习 45。 

在 稀疏 矩阵 的 线性 表 表 示 中 ， 去 除 结构 matrixTerm 的 数据 成 员 row， 用 数组 rowStart， 

rowStart[i] 表示 第 i 行 第 1 个 元 素 的 索引 ,第 i 行 的 元 素 索 引 是 rowStart[i]…rowStart[i+1]。 

1 ) 对 图 7-14a 的 稀 玻 矩阵 ， 做 出 类 似 图 7-14b 的 图 。 用 本 练习 的 表示 法 ， 显 示 出 在 行 主 次 
序 中 的 元 素 。 并 且 给 出 rowStart[1:5] 的 值 。 

2 ) 写 出 新 结构 newMatrixTerm， 表 示 非 0 元 素 。 与 结构 matrixTerm 不 同 之 处 在 于 ， 它 没 
有 数据 成 员 row。 

3 ) 用 本 练习 的 表示 法 设计 一 个 类 newSparseMatrix 以 实现 稀 玻 和 矩阵 。 它 不 仅 具 有 类 
sparseMatrix 的 所 有 方法 ， 而 且 还 有 get 和 set 方法 ( 见 练习 41 )。 

4) 测试 你 的 代码 。 

5 ) 对 类 newSparseMatrix 和 类 sparseMatrix 做 性 能 上 的 比较 。 

6 ) 对 一 个 约 有 6000 个 非 0 元 素 的 500 x 500 的 稀 玻 矩阵， 比较 在 两 个 类 中 ， 方 法 add 和 
transpose 的 运行 时 间 。 

对 练习 47 的 表示 方法 ,编写 矩 阵 乘法 代码 。 测 试 你 的 代码 。 

1 ) 对 图 7-8 的 和 矩阵， 做 出 类 似 图 7-15 的 图 。 


50. 


) 


Yh 


32， 
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2 ) 对 图 7-8b 的 矩阵， 做 出 用 linkedMatrix<T>::transpose 实现 的 转 置 矩阵 。 

1 ) 一 个 500 x 500 的 矩阵 ， 有 2000 个 非 0 元素。 用 500 x 500 的 二 维 整 型 数组 表示 时 ， 需 
要 多 少 空间 ? 用 linkedMatrix 表示 时 ， 需 要 多 少 空间 ? 

2 ) 一 个 mxn 和 矩阵 要 有 和 多少 个 非 0 元 素 ， 才 使 linkedMatrix 的 存储 所 需要 的 空间 超过 
m xn 二 维 数组 的 存储 所 需要 的 空间 ? 


. 给 类 linkedMatrix 增加 下 列 操 作 : 


1 ) 已 知 一 个 元 素 的 行 、 列 和 数值 ， 存 储 这 个 元 素 。 

2 ) 已 知 一 个 元 素 的 行 和 列 ， 从 和 矩阵 中 取出 这 个 元 素 。 

3 ) 两 个 稀 玻 矩阵 相 加 。 

4 ) 两 个 稀 踊 矩阵 相 减 。 

5 ) 两 个 稀 玻 矩阵 相 乘 。 

细 化 操作 符 >> 的 代码 ， 如 练习 42 所 要 求 的 那样 。 并 测试 代码 。 

设计 一 个 类 arrayMatrix， 每 一 行 的 非 0 元 素 用 一 个 数组 来 存储 。 这 种 表示 方法 与 7.4.3 节 

的 表示 方法 不 同 之 处 在 于 ， 链 表 被 数组 取代 。 实 现 方法 input、output、add、transpose 和 

multiply。 测 试 代码 。 

[垂直 链表 描述 法 ] 在 描述 稀 玻 和 抢 阵 的 另 一 种 链表 法 中 ， 链 表 节 点 包含 的 域 有 : down、 

right、row、col 和 value。 每 个 非 0 元素 都 用 一 个 节点 来 表示 。0 元 素 不 存储 。 所 有 节点 

链接 在 一 起 形成 两 个 循环 链表 。 第 一 个 链表 是 行 链表 ， 它 使 用 right 域 按 行 的 次 序 ( 每 行 

按 列 次 序 ) 链接 所 有 节点 。 第 二 个 链表 是 列 链表 ， 它 使 用 down 域 按 列 次 序 ( 每 列 按 行 次 

序 ) 链接 所 有 节点 。 这 两 个 链表 共享 同一 个 涉 节 点 。 此 外 ， 有 一 个 附加 的 节点 用 来 存储 和 矩 

阵 的 维 数 。 

1 ) 给 出 一 个 5 x8 的 矩阵 ， 它 正好 有 9 个 非 0 元 素 ， 并 且 每 行 和 每 列 至 少 有 一 个 非 0 元 
素 。 对 于 这 个 稀 玖 和 矩阵， 给 出 和 尼 直 链表 表示 。 

2 ) 假定 一 个 mxn 和 矩阵 有 1 个 非 0 元 素 ， 车 用 垂直 链表 表示 ， 则 1 应 该 多 小 才能 保证 所 需 
要 的 存储 空间 比 用 一 个 m x n 数组 来 表示 所 需要 的 空间 少 ? 

3 ) 设计 一 个 外 部 表示 方法 ， 可 用 来 输入 和 输出 ， 它 不 许 输入 0 元 素 。 

4) 设计 一 个 类 ， 它 采用 这 个 练习 的 表示 方法 ， 而 且 包 含 类 sparseMatrix 的 所 有 方法 。 

5 ) 对 于 类 的 每 个 公有 方法 ， 计 算 渐 近 时 间 复 杂 度 。 并 与 sparseMatrix 中 的 函数 比较 其 复 
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栈 和 队列 很 可 能 是 应 用 频率 最 高 的 数据 结构 。 我 们 在 第 5 章 和 第 6 章 曾 经 广泛 研究 了 线 
性 表 和 有 序 表 数据 结构 ， 而 栈 和 队列 是 它们 的 限制 版 。 栈 和 队列 的 应 用 广泛 ， 以 至 于 C++ 的 
标准 类 模板 库 STL 都 提供 了 用 数组 实现 的 栈 和 队列 。 我 们 在 本 章 研究 栈 ， 在 下 一 章 研 究 队 
列 。 尽 管 C++ 已 经 提供 了 栈 和 队列 ， 我 们 还 是 要 自己 动手 创建 ， 目 的 就 是 要 学 习 如 何 实现 这 
些 数据 结构 。 

把 线性 表 的 插入 和 删除 操作 限制 在 同一 端 进行 ， 就 得 到 栈 数 据 结 构 。 因 此 ， 栈 是 一 个 后 
进 先 出 last-in-first-out，LIFO ) 的 数据 结构 。 因 为 栈 是 一 种 特殊 的 线性 表 ， 所 以 从 相应 的 线 
性 表 类 派生 出 栈 类 是 很 自然 的 事情 。 基 于 数组 的 栈 类 可 以 从 第 5 章 的 基于 数组 的 线性 表 类 派 
生 ， 基 于 链表 的 栈 类 可 以 从 程序 6-2 的 链表 类 派生 。 通 过 类 的 派生 ， 程 序 设计 的 难度 大 大 降 
低 了 ， 但 是 代码 执行 的 效率 也 明显 降低 了 。 因 为 栈 是 一 个 很 基本 的 数据 结构 ， 许 多 程序 都 要 
用 到 它 ， 所 以 本 章 也 直接 创建 了 基于 数组 和 基于 链表 的 栈 类 ( 而 不 是 从 其 他 类 派生 )， 它 们 比 
派生 的 栈 具 有 更 好 的 执行 效率 。 

本 章 还 设计 了 6 个 栈 的 应 用 程序 。 第 一 个 应 用 是 简单 的 应 用 程序 ， 实 现 表 达 式 中 左右 括 
号 的 匹配 。 第 二 个 应 用 解决 经 典 的 汉 诺 塔 问题 。 汉 诺 塔 问题 要 求 把 一 个 塔 座 上 的 所 有 圆 盘 按 
照 一 定 的 规则 移 到 另 一 个 塔 座 上 ， 每 次 只 能 移动 一 个 圆 盘 ， 期 间 可 以 借助 第 三 个 塔 座 。 在 求 
解 过 程 中 ， 每 个 塔 座 都 被 视 为 一 个 栈 。 第 三 个 应 用 用 栈 表 达 车 采编 序 问题 ， 目 标 是 把 列车 车 
厢 按 所 希望 的 次 序 重 新 排列 。 第 四 个 应 用 电子 布线 问题 ， 在 这 个 应 用 中 ， 借 助 栈 来 确定 一 个 
电路 是 否 可 以 成 功 布线 。 第 五 个 应 用 重新 解决 6.5.4 节 的 离线 等 价 类 问题 ， 使 用 栈 可 以 在 线性 
时 间 内 确定 等 价 类 。 最 后 一 个 应 用 解决 经 典 的 迷宫 问题 ， 即 在 迷宫 中 寻找 一 条 从 入 口 到 出 口 
的 路 径 。 要 非常 仔细 地 研究 这 个 应 用 ， 因 为 其 解决 方法 体现 了 许多 软件 工程 的 原理 。 在 后 面 
的 章节 中 ， 还 有 更 多 的 栈 应 用 实例 。 


8.1 定义 和 应 用 


定义 8-1 栈 (stack) 是 一 种 特殊 的 线性 表 ， 其 插入 (也 称 入 栈 或 压 栈 ) 和 删除 ( 也 称 
出 栈 或 弹 栈 ) 操作 都 在 表 的 同一 端 进行 。 这 一 端 称 为 栈 顶 (top )， 另 一 端 称 为 栈 底 (bottom )。 

图 8-1a 给 出 了 一 个 4 个 元 素 的 栈 。 假 定 要 在 图 8-1a 的 栈 中 插 和 人 一 个 元 素 E， 这 个 元 素 
将 插 在 元 素 D 的 顶部 ， 结果 如 图 8-lb 所 示 。 如 果 要 从 图 8-1lb 的 栈 中 删除 一 个 元 素 ， 这 个 元 
素 便 是 E， 删 除 E 之 后 的 结果 是 图 8-1a。 如 果 对 图 8-1b 的 栈 连续 执行 三 次 删除 操作 ， 结 果 如 
图 8-1c 所 示 。 

从 上 面 的 讨论 可 以 看 出 ， 栈 是 一 个 后 进 先 出 表 。 这 种 类 型 的 表 在 计算 过 程 中 将 频繁 使 用 。 
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图 8-1 栈 的 布局 





例 8-1[ 现实 世界 的 栈 ] 
e 仔细 看 一 看 打印 机 (或 复印 机 ) 的 打印 纸 托盘 ， 你 会 发 现 ， 下 一 张 要 打印 的 纸 是 托盘 
最 上 面 的 纸 ; 当 你 往 托 盘 中 添加 一 张 打 印 纸 时 ， 你 是 把 它 放 到 托盘 的 顶部 。 打 印 纸 托 
盘 维 护 的 是 一 个 打印 纸 栈 ， 它 的 工作 方式 是 后 进 先 出 。 如 果 你 临时 想 在 一 张 带 有 机 构 
名 称 的 纸 上 或 者 格式 纸 上 打 印 ， 你 只 要 把 这 张 纸 放 到 托盘 的 上 面 就 可 以 了 ， 打 印 机 将 
在 你 需要 的 纸张 上 打印 。 
e 走 进 自助 餐厅 ， 你 会 发 现 一 摆 盘 子 。 当 你 进入 取 餐 队列 时 ， 会 从 这 操 盘 子 的 最 上 面 拿 出 
一 个 盘子 ; 当 盘 子 快 用 完了 ， 新 的 盘子 被 放 在 这 摆 盘 子 的 顶部 。 如 果 人 人 都 按 这 种 规矩 
行事 ， 那 么 在 自助 餐厅 里 的 那 操 盘子 便 是 我 们 定义 的 栈 结构 : 盘子 是 后 进 先 出 的 。 
e 新 学 期 伊始 ， 观 察 大 学 书店 里 任何 一 操 大 部 头 的 教科 书 ， 你 会 发 现 ， 每 一 个 要 买 这 种 
书 的 学 生 ， 都 是 从 最 上 面 拿 走 一 本 买 下 。 当 这 摆 书 差不多 要 卖 完 时 ， 一 个 店员 就 会 神 
秘 地 出 现 ， 在 上 面 又 放 上 一 些 书 。 这 摆 书 就 是 一 个 栈 : 后 进 先 出 。 上 
例 8-2[ 递归 ] 计算 机 是 如 何 执行 递归 函数 的 呢 ? 答案 是 使 用 递归 工作 栈 (recursion 
stack )。 当 一 个 函数 被 调用 时 ， 一 个 返回 地 址 ( 即 被 调 珊 数 一 旦 执行 完 ， 接 下 去 要 执行 的 程序 
指令 的 地 址 ) 和 被 调 函 数 的 局 部 变量 和 形 参 的 值 都 要 存储 在 递归 工作 栈 中 。 当 执行 一 次 返回 
时 ， 被 调 函 数 的 局 部 变量 和 形 参 的 值 被 恢复 为 调用 之 前 的 值 ( 这 些 值 存 储 在 递归 工作 栈 的 顶 
部 )， 而 且 程序 从 返回 地 址 处 继续 执行 ， 这 个 返回 地 址 也 存储 在 递归 工作 栈 的 顶部 。 
假定 递归 求 和 函数 rSum ( 见 程序 1-31 ) 由 哺 数 outerFunction 通过 下 面 的 语句 来 调用 : 


y=rSum(x, 2); 


这 条 语句 经 编译 后 形成 调用 rSum 的 代码 和 将 rSum 的 返回 值 赋 给 y 的 代码 。 今 1 是 将 rSum 
的 返回 值 赋 给 y 的 代码 中 第 一 条 指令 的 地 址 。 在 程序 1-31 中 ， 函 数 rSum 的 return 返回 语句 
经 编译 后 形成 调用 函数 的 rSum 代码 ， 后 边 是 将 返回 值 与 afn-1] 相 加 的 代码 ， 再 后 边 是 把 求 
和 结果 返回 的 代码 。 令 7, 是 将 返回 值 与 afn-1] 相 加 的 代码 中 第 一 条 指令 的 地 址 。 

当 图 数 outerFunction 执行 rSum(x,2) 的 调用 代码 时 ， 返 回 地 址 (7) 以 及 rsSum 的 形 参 和 
局 部 变量 的 值 ， 都 以 一 个 元 组 的 形式 保存 在 递归 调用 工作 栈 中 : 

(返回 地 址 , 形 和 参 的 值 , 局 部 变量 的 值 ) 

因为 这 时 的 a 和 n 还 没有 指定 的 值 ， 所 以 元 组 (11,*,*) ( 符号 * 代表 一 个 没有 指定 的 值 ) 被 插入 
递归 工作 栈 (注意 ，rSum 没有 局 部 变量 )。 然 后 rSum 的 形 参 被 赋予 新 的 值 。 参 数 a 的 赋值 是 
x， 它 是 数组 x[] 第 1 个 元 素 x[0] 的 引用 ， 参 数 n 的 赋值 是 2。 程序 从 rSum 的 第 一 条 指令 继续 
执行 。 

当 函 数 rSum 在 rSum 的 函数 体内 被 调用 时 ， 元 组 (1,x,2) 被 插入 递归 工作 栈 ; rSum 的 形 
参 被 赋予 新 的 值 (x 和 1); 然后 从 rSum 的 第 一 条 指令 继续 执行 。 函 数 rSum 在 rSum 的 函数 
体内 又 一 次 被 调用 ，(/,x*,1) 被 插入 递归 工作 栈 ; rSum 的 形 参 被 赋予 新 的 值 (x 和 0 ); 然后 从 
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rSum 的 第 一 条 指令 继续 执行 。 现 在 ， 人 参数 n 等 于 0，rSum 的 返回 值 是 0。 我 们 如 何 知道 返回 
的 地 址 是 生还 是 声 呢 ? 这 要 由 递归 工作 栈 的 栈 顶 元 组 来 决定 。 从 栈 底 到 栈 项 ， 栈 的 元 组 排列 
如 下 所 示 : 

[(11,*,*), (12,X,2), (12,x,1)] 

从 栈 顶 取出 元 组 (2,x,1)， 给 rSum 的 形 参 和 局 部 变量 重新 赋值 ，a 的 值 是 x，n 的 值 是 1。 
然后 从 地 址 2 处 继续 执行 指令 。 计 算 0+x[0]， 然 后 又 一 次 执行 返回 指令 。 这 时 ， 递 归 工 作 栈 
的 布局 如 下 : 

[(11,*,*), (12,x,2)] 

从 栈 顶 取出 元 组 (x,2)， 给 a 赋值 x，n 赋值 >， 返回 0+a[0] 的 和 ， 然 后 从 地 址 疡 处 继续 
执行 。 这 时 ， 将 a[1] 累加 到 0+a[0] 中 。 然 后 从 栈 顶 取出 (1,*,*)， 给 a 赋值 *，n 赋值 *， 返 回 
0+a[0]+a[1] 的 和 。 然 后 从 地 址 1 处 继续 执行 。 国 


练习 


人 台 为 空 的 栈 中 进行 : 压 人 4， 压 全， 弹 栈 , 压 人 T， 压 人 了 T， 压 
， 弹 栈 ， 弹 栈 ， 压 人 4， 压 人 D。 夯 出 类 似 图 8-1 的 图 ， 显 示 每 一 次 操作 之 后 栈 的 布局 。 
过 字 列 完成 练习 1 : 压 人 8$， 压 人 8$S， 压 人 了 ， 压 人 V， 弹 栈 ， 弹 栈 , 压 人 4， 压 
和 了 工 , 压 人 G， 弹 栈 , 压 人 C,， 压 人 4， 压 人 B， 弹 栈 ， 弹 栈 。 
3. 举 出 现实 世界 中 另外 三 个 关于 栈 的 应 用 。 





4. 显示 函数 rSum ( 见 程序 1-31 ) 在 每 一 次 调用 和 返回 时 递归 栈 的 内 容 。 初 始 调用 语句 是 
TSum(x,3)。 

5. 显示 函数 factorial ( 见 程序 1-29 ) 在 每 一 次 调用 和 返回 时 递归 栈 的 内 容 。 初 始 调用 语句 是 
factorial(3)。 


CN 


. 显示 函数 perm ( 见 程序 1-32 ) 在 每 一 次 调用 和 返回 时 递归 栈 的 内 容 。 初 始 调用 语句 是 
perm(x,0,2)。 


8.2 ”抽象 数据 类 型 


栈 的 抽象 数据 类 型 见 ADT 8-1。 栈 操作 方法 的 名 称 与 STL 中 栈 类 的 一 样 。 


抽象 数据 类 型 stack 
{ 
实例 
线性 表 ; 一 端 称 为 底 ， 另 一 端 称 为 项 
操作 
empty(): // 栈 为 空 时 返回 true， 否 则 返回 false 


size(): // 返回 栈 中 元 素 个 数 

top(): /返回 栈 顶 元 素 

pop0: /删除 栈 顶 元 素 
push(x): /将 元 素 x 压 人 栈 项 








ADT8-1 栈 的 抽象 数据 类 型 
程序 8-1 给 出 了 与 抽象 数据 类 型 stack 对 应 的 C++ 抽象 类 。 
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程序 8-1 C++ 抽象 类 栈 


template<class T> 
class stack 
{ 





public: 

Virtual ~stack() {} 

virtual bool empty() const = 0;} 
1/ 返回 true ， 当 且 仅 当 栈 为 空 

virtual int sizé() const = 0; 
/返回 栈 中 元 素 个 数 

Virtual T& top() = 0; 
/返回 栈 顶 元 素 的 引用 

virtual void pop() = 0; 
/删除 栈 顶 元 素 

virtual void Push(const Tg& theglement) = 0; 


1// 将 元 素 theElement 压 入 栈 顶 





8.3 数组 描述 


因为 栈 是 一 种 插入 和 删除 操作 都 被 限制 在 一 端 进行 的 线性 表 ， 所 以 可 以 使 用 5.3.3 节 的 任 
何 一 种 线性 表 的 描述 方法 。 如 果 把 数组 线性 表 的 右 端 定义 为 栈 顶 ,那么 人 栈 和 出 栈 操作 对 应 
的 就 是 线性 表 在 最 好 情况 下 的 插入 和 删除 操作 。 结 果 两 个 操作 的 时 间 都 为 0(1)。 


8.3.1 ”作为 一 个 派生 类 实现 


程序 8-2 是 从 类 arrayList 和 stack 派生 的 类 derivedArrayStack。 

类 derivedArrayStack 的 构造 函数 直接 调用 类 arrayList 的 构造 函数 ， 动 态 创建 一 维 数 组 ， 
数组 容量 (长度 ) 是 参数 initialCapaticy 的 值 。initialCapaticy 的 缺 省 值 是 10。 其 他 成 员 函 数 
的 代码 也 是 直接 调用 基 类 的 成 员 函 数 来 实现 的 。 


程序 8-2 一 个 从 类 arrayList 派生 的 数组 栈 类 








template<class T> 
class derivedArrayStack : private arrayListx<T>, 
public stack<T> 
{ 
public: 
derivedArrayStack (int initialCapacity = 10) 
: arrayList<T> (initialCapacity) {} 
bool empty () const 
{return arrayList<T>: :empty();} 


int size() const 
{return arrayList<T>: size()»} 
T& top() 


{ 
if (arrayList<T>::empty!() 
throw stackEmpty (); 
return get (arrayList<T>: :size() ~ 1); 
} 
void pop() 





if (arrayList<T>::empty()) 
throw stackEmpty(); 
erase (arrayList<T>::size() - 1); 
} 
void push(const T& theElement) 
{insert (arrayList<T>: :size(), theElement);} 
}; 


1. 类 derivedArrayStack 的 方法 复杂 度 

构造 函数 的 复杂 度 在 TT 是 基本 类 型 时 为 0(1)， 在 T 是 用 户 定义 的 类 型 时 为 OlinitialCapaticy)。 
插入 操作 的 复杂 度 在 数组 长 度 不 增加 时 为 9(1)， 在 增加 时 为 O(stack size)。 其 他 操作 的 复杂 度 
都 是 @(1)。 

2. 对 类 derivedArrayStack 的 评价 

函数 top 和 pop 都 在 类 方法 get 和 erase 之 前 检查 栈 是 否 为 空 。 因 为 基 类 的 方法 get 和 
erase 在 遇 到 空 栈 时 将 抛 出 异常 ， 所 以 我 们 可 以 从 top 和 pop 中 删除 对 空 栈 的 检查 ， 而 不 会 影 
响 程序 结果 。 但 是 ， 类 arrayList 的 方法 get 和 remove 抛 出 的 异常 是 illegalIndex 形式 的 ， 而 
派生 类 栈 的 用 户 在 调用 top 和 pop 时 ， 对 illegalIndex 形式 的 异常 会 感到 困惑 不 解 。 解 决 这 个 
问题 的 一 个 方案 是 用 一 个 try-catch 结构 代替 对 空 栈 的 检查 ,在 这 个 结构 中 ，catch 块 将 捕捉 基 
类 抛 出 的 异常 ， 然 后 抛 出 新 的 、 符 合意 义 的 异常 来 替代 。 程 序 8-3 给 出 的 方法 top 就 是 应 用 了 
这 个 方案 之 后 的 代码 。 相 应 的 类 称 为 derivedArrayStackWithCatch 。 


程序 8-3 ”使 用 try-catch 结构 的 top 的 实现 
T& top () 
{ 
try {return get (arrayList<T>: :size() - 1);} 
catch (illegalindex) 
{throw stackEmpty();} 


} 





arrayList 的 派生 类 derivedArtayStack 具有 访问 权限 修饰 符 private。 因 此 ，arrayList 的 公 
有 和 保护 性 方法 以 及 数据 成 员 都 是 类 derivedArrayStack 可 以 访问 的 。 尤 其 是 ， 栈 stack 的 用 
户 不 能 访问 arrayList 的 方法 get 、insert、erase， 因 此 ，LIFO 原则 得 以 在 类 derivedArrayStack 
的 实例 上 贯彻 执行 。 

数组 形式 的 栈 的 另 一 种 非常 类 似 的 实现 方法 是 用 类 arrayList 的 一 个 数据 成 员 stack， 并 用 
线性 表 stack 的 操作 来 定义 栈 方法 。 这 个 代码 与 程序 8-2 非常 相似 。 数 据 成 员 stack 可 以 选择 
为 一 个 工 类 型 的 数组 ，stack 的 方法 代码 可 以 不 使 用 线性 表 linearList 的 任何 方法 。 我 们 在 下 
一 节 讨 论 这 种 方法 。 


8.3.2 类 arrayStack 

当 我 们 像 程 序 8-2 那样 通过 线性 表 类 的 派生 得 到 一 个 栈 类 时 ， 付 出 的 代价 是 性 能 的 损 
失 。 例如 ,每 当 我 们 往 栈 中 搬入 一 个 元 素 时 ，push 方法 都 会 调用 arrayList 的 insert 方法 
arrayList<T>::insert。 这 个 方法 在 实际 插入 一 个 新 元 素 之 前 要 进行 下 标 检查 ， 可 能 要 将 数组 加 
长 ， 而且 还 要 往 回 复制 ( copy-backward )。 下 标 检 查 和 往 回 复制 是 不 必要 的 ， 因 为 我 们 总 是 
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把 新 元 素 插 入 线性 表 的 右 端 。 

要 得 到 一 个 性 能 更 好 的 数组 栈 的 实现 方法 ， 一 种 途径 就 是 开发 一 个 类 ， 它 利用 数组 stack 
来 包含 所 有 的 栈 元 素 。 程 序 8-4 给 出 的 类 arrayStack 便 是 这 样 做 的 。 栈 底 元 素 是 stack[0]， 栈 
顶 元 素 是 stack[stackTop]。 它 利用 arrayList 的 代码 实现 arrayStack 的 方法 ， 同 时 排除 arrayList 
的 代码 中 多 余 的 部 分 。 在 渐 近 时 间 复 杂 度 方面 ，arrayStack 的 每 一 种 方法 与 derivedArrayStack 
的 相应 部 分 一 样 。 


程序 8-4 类 arrayStack 


template<class T> 
class arrayStack : public stack<T> 
{ 
Dublic: 
arraySsStack (int initialCapacity = 10); 
~arrayStack() {delete [] stack;} 


bool empty() const {return stackTop == -1;} 
int size() const 
{return stackTop + 1;} 
TS top() 
' 
if (stackTop == -1) 


throw stackEmpty(); 
return stack[stackTop]; 
} 


void pop() 
| 
if (stackTop == -1) 
throw stackEmpty (); 
stack[stackTop--] .~T(); /WT 的 析 构 函数 


} 
void push(const T& theElement); 


private: 
int stackTop; 1/ 当前 栈 顶 
int arrayLength; // 搁 容 量 
T *stack; // 元 素数 组 


上 
template<class T> 
arrayStack<T>: :arrayStack (int initialCapacity) 
{V 构造 函数 
if (initialCapacity < 1) 
{ostringstream s; 
s << "Initial capacity = " << initialCapacity << " Must be > 0"; 
throw illegalParameterValue(s.str()); 
} 
arrayLength = initialCapacity; 
stack = new TlarrayLength]; 
stackTop = -1; 


template<class T> 
void arrayStack<T>:; :push (const T& theElement) 
{// 将 元 素 theElement 压 入 栈 
if (stackTop == arrayLength - 1) 
{1/ 空间 己 满 ， 容 量 加 倍 








changeLengthlD(stack, arrayLength, 2 * arrayLength); 


arrayLength *= 2; 


} 
// 在 栈 顶 插入 


stack[l++stackTop] = theElement; 


} 


8.3.3 性 能 测量 


尽管 数组 栈 类 arrayStack(AS) 、derivedArrayStack(DAS) 和 C++ STL 容器 类 stack(STL) 都 
实现 了 栈 的 抽象 数据 类 型 的 所 有 方法 ， 而 且 渐 近 时 间 复 杂 度 相同 ， 但 是 ， 每 一 种 类 方法 的 实 


际 性 能 都 不 尽 相同 。 


我 们 定义 一 个 n- 操作 序列 ， 它 是 由 首先 执行 的 mn 次 push 操作 ， 加 上 随后 交替 执行 的 


次 top 操作 和 nn 次 pop 操作 所 构成 的 操作 序列 。 
图 8-2 是 执行 50 000 000- 操作 序列 时 测量 的 时 
间 ， 图 8-3 是 相应 的 条 形 图 。| 除 了 STL 的 栈 类 ， 
其 他 栈 类 都 分 两 种 情况 测量 了 运行 时 间 : 1 ) 栈 的 
初始 容量 是 缺 省 值 , 2) 栈 的 初始 容量 是 
50 000 000。 对 STL 的 栈 类 ， 我 们 没有 测量 它 在 
第 2 ) 种 情况 下 的 运行 时 间 ， 因 为 它 的 构造 函数 
不 允许 指定 初始 容量 。 








初始 容量 


50000 000 
2.7 


arrayStack 1.5 
derivedArrayStack 7.5 6.3 
stack 4 - 






时 间 单 位 : 秒 
图 8-2 不 同 数组 栈 的 实现 方法 之 用 时 


当 栈 的 初始 容量 是 默认 值 的 时 候 ， 执 行 50 000 000- 操作 序列 ，STL 的 栈 所 用 时 间 是 栈 


arrayStack 的 两 倍 。 当 初始 容量 为 50 000 000 时 ， 
性 能 之 比 突 增 到 3.7， 这 是 因为 类 stack 不 允许 
指定 初始 容量 ， 因 此 改变 数组 大 小 的 操作 在 所 难 
免 。 将 STL 的 栈 和 derivedArrayStack 栈 做 性 能 
比较 更 恰当 ， 因 为 它们 都 是 具体 的 线性 表 类 派生 
的 。 STL 的 栈 stack 派 生 于 STL 的 类 deque ( 见 
练习 9-9 )， 而 derivedArrayStack 派生 于 arrayList。 
stack 比 derivedArrayStack 的 性 能 更 好 ， 主 要 是 因 
为 deque 没有 索引 检查 ， 而 arrayList 有 。 

本 节 中 两 个 栈 的 实现 方法 在 改变 数组 容量 的 
操作 中 所 用 时 间 近 似 相 等 (大约 1.2 秒 )， 进 行 这 
种 检验 不 仅 是 有 趣 的 ， 而 且 是 我 们 期 竺 的。 如果 








8 

6 的 多 

开 

中 

21 多 
| 

0 为 
B 

A= 缺 省 初始 容量 


B= 初始 容量 是 50 000 000 
rl AS EZ Dnas i STL 


图 8-3” 栈 的 运行 时 间 ， 单 位 是 秒 


一 个 数组 缺 省 长 度 为 10， 那 么 类 arrayStack 在 改变 数组 容量 时 所 用 的 时 间 占 总 时 间 的 44%。 


练习 


7. 1 ) 对 栈 的 ADT 进行 扩充 ， 增 加 以 下 函数 : 
i. 输入 栈 。 
ii. 将 一 个 栈 转变 为 一 个 适合 输出 的 串 。 


iii. 将 一 个 栈 分 裂 为 两 个 栈 。 第 一 个 栈 包含 从 栈 底 开始 的 一 半 元 素 ， 第 二 个 栈 包含 剩余 元 素 。 
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_iv. 将 两 个 栈 合 并 ,把 第 二 个 栈 的 所 有 元 素 置 于 第 一 个 栈 的 顶部 。 不 改变 第 二 个 栈 中 元 素 
的 相对 顺序 。 

2 ) 定义 抽象 类 extendedStack， 它 扩展 抽象 类 stack ( 见 程序 8-1 )， 而 且 包 含 与 1) 中 函数 对 
应 的 方法 。 

3 ) 开发 具体 类 extendedDerivedArrayStack 和 extendedArrayStack， 它 们 的 基 类 是 extendedStack， 
而 且 各 自 派 生 于 derivedArrayStack 和 arrayStack。 

4 ) 测试 你 的 代码 的 正确 性 。 

8. 考察 类 arrayStack。 证 明 即 使 个 别 push 操作 可 能 用 时 为 @( 栈 的 大 小 )， 栈 的 任何 个 操作 

构成 的 操作 序列 所 需要 的 时 间 为 O(n)。 

9. 考察 类 arrayStack。 

1 ) 如 程序 8-4 所 示 ， 一 个 栈 的 容量 可 能 增加 ， 但 不 会 减少 。 为 了 更 有 效 地 使 用 空间 ， 请 修 
改 pop 的 实现 代码 ， 使 得 当 pop 操作 将 栈 中 元 素 减 少 到 不 足 原来 的 四 分 之 一 时 ， 栈 容量 
减少 到 当前 容量 的 一 半 。 

2 ) 证 明 即 使 个 别 push 和 pop 操作 可 能 用 时 为 @( 容量 )， 栈 的 任何 n- 操作 序列 所 需要 的 时 
间 仍 为 O(n)。 

10. 开发 具体 类 stackWithArrayList， 它 派生 于 抽象 类 stack。 这 个 类 具有 单个 数据 成 员 list， 其 
类 型 为 arrayList<T>。 评 价 类 derivedArrayStack 和 stackWithArrayList 各 自 的 优点 。 

11. 开发 类 twoStacks， 它 用 一 个 数组 描述 两 个 栈 。 一 个 栈 的 栈 底 在 位 置 0， 另 一 个 栈 的 栈 底 在 
位 置 arrayLength-1。 两 个 栈 都 向 数组 topl top2 
的 中 间 增 长 ( 见 图 8-4 )。 该 类 的 方法 
必须 能 够 在 每 一 个 栈 中 实施 ADT 栈 的 
所 有 操作 。 而 且 每 一 个 方法 的 复杂 度 | 
应 为 0(1)， 其 中 不 包括 改变 数组 大 小 栈 1 
所 需要 的 时 间 。 n=arrayLength-l 

8-4 ”一 个 数组 中 的 两 个 栈 

8.4 链表 描述 


当 用 链表 描述 栈 时 ， 我 们 必须 确定 用 链表 的 哪 一 端 表示 栈 顶 。 若 用 链表 的 右 端 作为 栈 顶 ， 
则 栈 操 作 top 、push 和 pop 的 实现 需要 调用 链表 方法 get(size()-1)、insert(size(),theElement) 和 
erase(size()-1)。 每 一 个 链表 方法 需要 用 时 O(size0)。 而 用 链表 的 左 端 作为 栈 顶 ， 需 要 调用 的 
链表 方法 是 get(0)、insert(0,theElement) 和 erase(0)， 其 中 每 一 个 链表 方法 需要 用 时 6@(1)。 分 
析 表 明 ， 我 们 应 该 选择 链表 的 左 端 作为 栈 项 。 


[n] 














8.4.1 类 derivedLinkedStack 


类 derivedLinkedStack 从 chain ( 见 程序 6-2 ) 派生 ， 实 现 了 抽象 类 stack， 其 代码 可 
以 从 derivedArrayStack 的 代码 ( 见 程序 8-2) 得 到 ,但 是 要 用 分 句 private chain<T> 替代 
private arrayList<T>， 用 名 称 derivedLinkedStack 替代 名 称 derivedArrayStack， 将 方法 get、 
insert 和 erase 的 调用 中 作为 索引 的 实 参 改 为 0， 使 这 些 操作 发 生 在 链表 的 左 端 。 这 样 做 有 什 
么 好 处 ? 因为 使 用 了 面向 对 象 设计 中 信息 隐藏 和 封装 的 原理 ， 所 以 大 大 简化 了 程序 的 设计 。 
derivedLinkedStack 的 每 一 种 方法 ( 包括 构造 函数 和 push 方法 ) 的 时 间 复 杂 度 都 为 9(1)。 
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8.4.2 类 linkedStack 


就 像 类 arrayStack ( 见 程序 8-4 ) 一 样 ， 我 们 可 以 定制 代码 而 不 是 从 类 chain 派生 ， 由 此 
改进 代码 的 时 间 性 能 。 程 序 8-5 便 是 这 样 的 定制 代码 。 


程序 8-5 ”定制 链表 栈 


template<class T> 

class linkedstack : public stack<T> 

pt 

public: 
linkedSstack (int initialCapacity = 10) 
{stackTop = NULL; stackSize = 0;} 

~linkedStack(); 
bool empty() const 


{return stackSize == 0;1} 
int size() const 
{return stackSize;} 
T& top() 
{ 
if (StackSize == 0) 


throw stackEmpty(); 
return stackTop->element; 
} 
void pop(); 
void Push (const T& theElement) 
{ 
stackTop = new chainNode<T> (theElement, stackTop); 
stackSize++t; 


} 


private: 
chainNode<T>* stackTop; / 栈 顶 指针 
int stackSize' / 栈 中 元 素 个 数 


}; 
template<class T> 
linkedStack<T>::~linkedSstack () 
{/ 析 构 函数 
while {stackTop != NULL) 
{VW 删除 栈 顶 节点 
chainNode<T>* nextNode = stackTop->next; 
delete stackTop; 
stackTop = nextNode; 


template<class T> 
void linkedStack<T>::pop!() 
{/ 删除 栈 顶 节点 
if (stackSize == 0) 
throw stackEmpty(); 


chainNode<T>* nextNode = stackTop->next; 
delete stackTop; 

stackTop = nextNode; 

stackSize-—-; 
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8.4.3 性 能 测量 


执行 50 000 000- 操作 序列 ，derivedLinkedStack 和 linkedStack 分 别 耗 时 41 秒 和 40.5 秒 
(这 些 时 间 是 由 一 个 10 000 000- 操作 序列 的 时 间 乘 以 5 得 到 的 )。 与 图 8-2 的 时 间 比 较 可 以 看 
出 ， 如 果 linkedStack 和 arrayStack 比较 运行 时 间 ， 那 么 当初 始 容 量 为 10 的 时 候 ， 前 者 是 后 者 
的 15 倍 ; 当初 始 容量 为 50 000 000 的 时 候 ， 前 者 是 后 者 的 27 倍 。 


练习 


12. 在 某 些 栈 应 用 中 ， 要 插入 的 元 素 已 经 存储 在 类 型 为 chainNode 的 节点 中 。 对 此 ， 需 要 方法 
pushNode(chainNode* theNode) 把 节点 theNode 压 人 栈 ， 还 需要 方法 popNode 把 栈 顶 节点 
删除 并 返回 。 

1 ) 编写 这 两 个 方法 的 代码 。 


2 ) 测试 代码 。 
3 ) 比较 pushNode 和 popNode 的 10 000 000- 操作 序列 与 push 和 pop 的 10 000 000- 操作 
序列 的 性 能 。 


13. 设计 具体 类 extendedLinkedStack， 它 派生 于 类 linkedStack 和 抽象 类 extendedStack ( 见 练 
坷 了 虑 

14. 用 push 和 pop 的 10 000 000- 操作 序列 比较 图 8-2 的 数组 栈 、 链 栈 derivedLinkedStack 和 
linkedStack 的 性 能 。 数 组 栈 的 初始 容量 是 缺 省 值 。 数 组 容量 加 倍 的 操作 在 这 个 实验 中 会 出 
现 吗 ? 为 什么 ? 


8.5 应 用 
8.5.1 括号 匹配 
1. 问题 描述 


我 们 要 做 的 是 : 对 一 个 字符 串 的 左右 括号 进行 匹配 。 例 如 ， 字 符 串 (ax* (b+c ) +d ) 在 位 
置 0 和 3 有 左 括号 ， 在 位 置 7 和 10 有 右 括号 。 位 置 0 的 左 括号 与 位 置 10 的 右 括号 匹配 ， 位 
置 3 的 左 括号 与 位 置 7 的 右 括号 匹配 。 在 字符 串 (atb )) (中 ,位置 5 的 右 括号 没有 与 之 匹配 
的 左 括号 ， 位 置 6 的 左 括号 没有 与 之 匹配 的 右 括号 。 我 们 的 目标 是 编写 一 个 C++ 程序 ， 其 输 
入 是 一 个 字符 串 ， 输 出 是 匹配 的 括号 以 及 不 匹配 的 括号 。 注 意 ， 括 号 匹配 问题 等 价 于 C+ 程 
序 中 的 上 匹配 问题 。 

2. 求解 策略 

通过 观察 可 以 发 现 ， 如 果 从 左 至 右 地 扫描 一 个 字符 串 ， 那 么 每 一 个 右 括号 都 与 最 近 扫 描 
的 那个 未 匹配 的 左 括号 相 匹 配 。 这 种 观察 结果 促使 我 们 在 从 左 至 右 的 扫描 过 程 中 ， 将 扫描 到 
的 左 括号 保存 到 栈 中 。 每 当 扫描 都 一 个 右 括号 ， 就 将 它 与 栈 顶 的 左 括号 ( 如 果 存 在 ) 相 匹 配 ， 
并 将 匹配 的 左 括号 从 栈 顶 删除 。 

3. C++ 实现 

程序 8-6 给 出 了 相应 的 C++ 程序 。 


程序 8-6 输出 匹配 的 括号 
void printMatchedPairs(string expr) 
{1/ 括号 匹配 





arrayStack<int> s; 
int length = (int) expr.size(); 


// 扫描 表达 式 expr 寻找 左 括号 和 右 括号 
for (nt i = 0; i < length; i++) 
if (expr.at (i) == '(') 
s.push (i); 
else 
if (expr.at(i) == ')') 
ty 
{V 从 栈 中 删除 匹配 的 左 括号 
eic 
Ss".pop()} 1/ 没有 栈 匹配 
} 
catch (stackEmpty) 
{// 模 为 空 。 没 有 匹配 的 左 括 号 
cout << "No match for right parenthesis" 
<< " at " <<1 << endl; 
} 


1/ 栈 不 为 空 。 剩 余 在 栈 中 的 左 括号 是 不 匹配 的 
while (!s.empty() ) 
{ 
Cout << “No match for left parenthesis at " 
<< s.top() << endl; 
s.pop(); 


} 


4. 复杂 度 

程序 8-6 的 时 间 复 杂 度 是 O(n)， 其 中 为 输入 表达 式 的 长 度 。 要 理解 这 个 结果 需要 注意 ， 
程序 执行 了 O(n) 次 人 栈 和 O(n) 次 出 栈 。 尽 管 个 别人 栈 操作 时 间 的 复杂 度 为 O( 容量 ) ( 因为 
数组 容量 加 倍 )， 但 O(n) 次 入 栈 操作 的 时 间 复 杂 度 依然 是 0(n)。 每 一 次 出 栈 操作 的 时 间 复 杂 
度 是 0(1)， 因 此 O(n) 次 出 栈 操作 的 时 间 复 杂 度 是 O(n)。 


8.5.2” 汉 诺 塔 


1. 问题 描述 

汉 诺 塔 (Towers of Hanoi ) 问题 来 自 大 焚 天 创 世 的 一 个 古老 传说 。 在 创 志 之 日 ， 有 一 座 
销 石 宝塔 ( 塔 1)， 其 上 有 64 个 金 碟 (如 图 8-5 所 示 )， 所 有 碟子 从 大 到 小 从 塔 底 堆 到 塔 顶 ， 
旁边 还 有 另外 两 座 钻 石 宝 塔 ( 塔 2 和 塔 3 )。 从 创 世 之 日 起 ， 婆 罗 门 一 直 试 图 把 塔 1 上 的 碟子 
移 到 塔 2 上 去 ， 不 过 要 借助 塔 3。 由 于 碟子 非常 重 ， 所 以 一 次 只 能 移动 一 个 碟子 。 另 外 ， 任 
何 时 候 大 碟子 都 不 能 压 在 小 碟子 上 面 。 根 据 这 个 传说 ， 等 到 婆罗 门 把 盘子 搬 完了 ， 世 界 末日 
也 就 到 了 。 

在 汉 诺 塔 问题 中 ,假设 有 个 碟子 和 3 座 塔 。 初始 时 所 有 碟子 从 大 到 小 堆 在 塔 1 上 ,我 
们 要 把 碟子 都 移动 到 塔 2 上 ， 每 次 移动 一 个 ， 而 且 任何 时 候 都 不 能 把 大 碟子 压 在 小 碟子 上 面 。 
再 继续 往 下 阅读 之 前 ， 可 以 尝试 令 n=2,3 和 4 来 解决 这 个 问题 。 





塔 1 塔 2 塔 3 
图 8-5 汉 详 塔 问题 


2. 求解 策略 

一 个 简洁 的 解决 方法 是 递归 。 为 了 把 最 大 的 碟子 移 到 塔 2 的 底部 ， 必 须 把 其 余 n-1 个 碟 
子 移 到 塔 3， 然 后 把 最 大 的 碟子 移 到 塔 2。 接 下 来 是 把 塔 3 上 的 n-1 个 碟子 移 到 塔 2。 为 此 可 
以 利用 塔 2 和 塔 1。 可 以 完全 忽略 塔 2 上 已 有 的 一 个 碟子 ， 因 为 这 个 碟子 比 塔 3 上 将 要 移 过 
来 的 所 有 碟子 都 大 ， 在 它 项 上 可 以 堆放 任何 一 个 人 碟子。 

3. 第 一 种 实现 方法 

程序 8-7 给 出 了 按 递归 方式 求解 汉 诺 塔 的 C+ 代码。 初始 调用 语句 是 towersOfHanoi (n， 
1，2，3 )。 程 序 8-7 的 正确 性 很 容易 证 明 。 


程序 8-7 求解 汉 诺 塔 问题 的 递归 方法 
veid towersOEHanoti (int mn, nt x, int yy int 2) 
{1/ 把 塔 x 顶部 的 n 个 碟子 移 到 塔 y 
1/ 用 塔 z 作为 中 转 地 
i 0) 
{ 
towersOfHanoi (n-1, x, z, y); 





Cout << "Move top disk from tower " << x 
< V to top Gf teower ™ << y << endl; 
towersOfHanoi (n-l;, Zr Yy: xX);? 


} 


4. 时 间 复 杂 度 
程序 8-7 的 运行 时 间 正 比 于 输出 的 信息 行 数目 ， 而 信息 行 数 目 等 于 碟子 移动 的 次 数 。 分 
析 程 序 8-7 可 以 得 到 碟子 移动 次 数 的 递归 式 moves(n): 
moves (n) = : ma 
2moves(n—-1)+1 n>0 
可 以 使 用 第 2 章 介 绍 的 迭代 方法 ( 见 程序 2-20 ) 来 计算 这 个 公式 。 得 到 的 结果 应 为 
moves(n)=2"-1。 可 以 证 明 ，2”-1 实际 上 是 最 少 的 移动 次 数 。 在 大 栖 天 的 宝塔 中 n=64， 因 此 
大 焚 天 的 婆罗 门 需要 很 多 年 才 可 以 完成 任务 。 根 据 上 面 的 公式 ， 可 以 判定 函数 towersOfHanoi 
的 复杂 度 为 6(2”)。 
5. 第 二 种 实现 方法 
程序 8-7 的 输出 是 把 碟子 从 塔 1 移 到 塔 2 的 移动 次 序 。 假 定 我 们 要 显示 出 每 次 移动 之 后 





三 座 塔 的 布局 ( 即 塔 上 的 碟子 和 它们 从 底 到 顶 的 次 序 )， 那 就 必须 在 内 存 中 保留 这 些 布局 ， 并 
在 每 次 移动 碟子 之 后 对 塔 的 布局 进行 修改 。 这 样 每 移动 一 个 碟子 ， 就 可 以 在 一 个 输出 设备 
(如 计算 机 屏幕 、 打 印 机 、 录 像 机 ) 上 输出 塔 的 布局 。 

从 每 个 塔 上 移 走 碟子 是 按照 LIFO 方式 进行 的 ， 因 此 可 以 把 每 个 塔 表 示 成 一 个 栈 。 三 座 
塔 在 任何 时 候 都 总 共有 nn 个 碟子 ， 因 此 ， 如 果 使 用 链表 形式 的 栈 ， 只 需 申 请 个 元 素 空 间 ; 
如 果 使 用 数组 形式 的 栈 ， 那么 因为 塔 1 和 塔 2 的 容量 都 必须 是 n， 塔 3 的 容量 必须 是 n-1， 因 
此 所 需要 的 总 空间 为 3n-1。 前 面 的 分 析 已 经 指出 ， 汉 诺 塔 问题 的 复杂 度 是 以 n 为 指数 的 函数 ， 
因此 ， 在 可 以 接受 的 时 间 范 围 内 ， 只 能 解决 值 比较 小 (如 n < 30) 的 汉 详 塔 问题 。 对 于 这 
些 比 较 小 的 n 值 ， 数 组 形式 的 栈 和 链表 形式 的 栈 在 空间 需求 上 差别 相当 小 ， 因 此 用 哪 一 种 都 
可 以 。 但 是 ， 数 组 形式 的 栈 比 链表 形式 的 栈 运行 速度 要 快 ， 因 此 我 们 还 是 用 数组 形式 的 栈 。 

程序 8-8 使 用 了 数组 描述 的 栈 。towersOfHanoi(n) 仅仅 是 递归 函数 moveAndShow 的 预 处 
理 程序 ，moveAndShow 是 以 程序 8-7 为 模式 来 设计 的 。 预 处 理 程序 创建 三 个 堆栈 tower[1:3] 
用 来 储存 3 座 塔 的 布局 。 所 有 碟子 从 1 ( 最 小 的 碟子 ) 到 nn (最 大 的 碟子 ) 编号 。 因 为 碟子 用 
整数 来 模拟 ， 所 以 栈 元 素 类 型 为 int。 初 始 布局 是 所 有 碟子 在 tower[1] 中 ， 其 他 两 座 塔 为 空 。 
构建 好 初始 布局 之 后 ， 预 处 理 程序 调用 函数 moveAndShow。 


程序 8-8 ”使 用 栈 求解 汉 诺 塔 问题 


/全 局 变量 ，tower[1:3] 表示 三 个 塔 
arrayStack<int> tower[4]; 








void moveAndShow (int, int, int, int); 


void towersofHanoi (int n) 
{// 函数 moveAndShow 的 预 处 理 程序 
for (int d= n; d > 0; d--) // 初始 化 
tower [1] .push (d); // 把 碟子 ga 加 到 塔 1 


1/ 把 个 碟子 从 塔 工 移 到 塔 3， 用 塔 2 作为 中 转 站 
moveAndSshow (n, 1, 2, 3); 
} 


void moveAndShow (int n, int x, int y, int z) 
{1/ 把 塔 x 顶部 的 nn 个 碟子 移 到 塔 y， 显 示 移 动 后 的 布局 
/用 塔 z 作为 中 转 站 

Tf i SS OY 

{ 


moveAndShow (n-1, x, ZzZ, y); 





int d = tower[x] .top(); 1/ 把 一 个 碟子 
tower [x] .pop (); 1/ 从 塔 x 的 顶部 移 到 
tower[y] .push (d); 1/ 塔 y 的 顶部 
showState (); /显示 塔 3 的 布局 


moveAndShow (n=-1, z, y, Xx); 


8.5.3 ”列车 车 厢 重 排 


1. 问题 描述 
一 列 货运 列车 有 节 车 磺 ， 每 节 和 车厢 要 停靠 在 不 同 的 车 站 。 假 设 个 车 站 从 1 到 编号 ， 


188 ”和 荔 二 南 分 颖 握 千 移 


而 且 货 运 列车 按照 从 n 到 1 的 顺序 经 过 车 站 。 车 厢 的 编号 与 它们 要 停靠 的 车 站 编号 相同 。 为 
了 便于 从 列车 上 利 掉 相应 的 车 厢 ， 必 须 按 照 从 前 至 后 、 从 1 到 的 顺序 把 车 厅 重 新 排列 。 这 
样 排列 之 后 ， 在 每 个 车 站 只 需 件 掉 最 后 一 节 车 厢 即 可 。 车 厢 重 排 工 作 在 一 个 转轨 站 ( shunting 
yard ) 上 进行 ， 转 轨 站 上 有 一 个 入 轨道 (input track )、 一 个 出 轨道 (output track ) 和 大 个 缓冲 
轨道 (holding track )。 缓 冲 轨道 位 于 人 轨道 和 出 轨道 之 间 。 图 8-6a 显示 了 一 个 转轨 站 ， 其 中 
有 3 个 缓冲 轨道 8H1、H2 和 3， 即 本 3。 开 始 时 ， 挂 有 nn 节 车 有 厢 的 货车 开始 在 人 轨道 ， 而 最 
后 在 出 轨道 上 的 顺序 是 从 右 到 左 ， 从 1 至 n。 在 图 8-6a 中 ，n=9， 车 硕 从 后 至 前 的 初始 顺序 为 
5，8，1，7,，4，2，9，6,， 3。 图 8-6b 是 按 要 求 的 顺序 重新 排列 的 结果 。 


[581742963] [987654321] 
入 轨道 出 轨道 
HI H2H3 HIH2H3 
a) 初始 时 b) 最 后 


图 8-6 具有 三 个 缓冲 轨道 的 转轨 站 


2. 求解 策略 

为 了 重 排 车 厢 ， 我 们 从 前 至 后 检查 人 轨道 上 的 车 磺 。 如 果 正 在 检查 的 车 厢 是 满足 排列 要 
求 的 下 一 节 车 厢 ， 就 直接 把 它 移 到 出 轨道 上 上。 如果 不 是 ， 就 把 它 移 到 一 个 缓冲 轨道 上 ， 直 到 
它 满足 排列 要 求 时 才 将 它 移 到 出 轨道 上 。 组 冲 轨道 是 按照 LIFO 的 方式 管理 的 ， 车 厢 的 进出 
都 在 缓冲 轨道 的 顶部 进行 。 在 重 排 车 厢 过 程 中 ， 仅 允许 以 下 移动 : 

e 车 有 可 以 从 入 轨道 的 前 端 ( 即 右 端 ) 移动 到 一 个 缓冲 轨道 的 顶部 或 出 轨道 的 后 端 ( 即 

左 端 )。 

e 车 胡可 以 从 一 个 缓冲 轨道 的 项 部 移 到 出 胃 道 的 后 端 。 

考虑 图 8-6a 的 人 轨道 上 的 车 厢 排 列 。3 号 车 厢 在 人 轨道 上 的 前 端 ， 但 是 不 能 将 它 移 到 出 
轨道 上 ， 因 为 1 号 和 2 号 车 厢 必 须 排 在 它 前 面 。 因 此 ，3 号 车 厢 被 印 下 ， 移 到 缓冲 轨道 万 1。 
人 轨道 上 的 下 一 节 车 胡 是 6 号， 也 必须 移 到 缓冲 轨道 。 如 果 把 6 号 车 厅 移 到 1， 那么 重 排 过 
程 无 法 完成 ， 因 为 3 号 车 胡 在 6 号 车 有 胡 的 下 面 ， 它 无 法 在 6 号 车 厢 之 前 从 Hl 进入 出 轨道 。 
于 是 要 把 6 号 车 厢 移 到 有 2。 入 轨道 上 的 下 一 节 车 厢 是 9 号 ， 它 被 移 到 HH3， 因 为 如 果 把 它 移 
到 HI1 或 H2， 重 排 过 程 也 无 法 完成 。 请 注意 : 当 任 何 一 条 缓冲 轨道 上 的 车 而 不 是 从 顶 到 底 按 
照 递增 序 排 列 时 ， 重 排 过 程 都 无 法 完成 。 缓 冲 轨 道 的 当前 状态 如 图 8-7a 所 示 。 

接 下 来 考虑 2 号 车 厢 。 它 可 以 进入 任何 一 a 
个 缓冲 轨道 ， 但 是 要 优先 选择 H1。 因 为 如 果 它 
进 到 H3， 那 么 缓冲 轨道 就 无 法 按 排列 要 求 容纳 
7 号 和 8 号 车 厢 。 如 果 2 号 车 厢 进 到 上 2， 那 么 
接 下 来 的 4 号 车 厅 就 必须 进 到 H3， 这 样 一 来 ， 
缓冲 轨道 将 无 法 按 排列 要 求 容纳 5 号 、7 号 和 8 图 -7 声 溃 宙 道 状态 
号 车 采 。 对 缓冲 轨道 选择 的 最 基本 的 要 求 是 :编号 为 到 的 车 而 应 该 进入 的 缓冲 轨道 ， 其 顶部 
车 厅 编 号 是 大 于 x 的 最 小 者 。 我 们 将 依据 这 条 分 配 规则 (assignment rule ) 来 选择 缓冲 轨道 。 

当 考 虑 4 号 车 厢 时 ， 三 个 缓冲 轨道 顶部 的 车 厢 分 别 是 2 号 、6 号 和 9 号。 根据 分 配 规则 ， 








4 号 车 厢 进 到 Ai2P2。 然 后 7 号 车 厢 进 到 H3。 图 8-7b 给 出 了 缓冲 轨道 的 当前 布局 。 接 下 来 是 1 
号 车 厢 ， 它 直接 进入 出 轨道 。 现 在 把 2 号 车 厢 从 HI1 移 到 出 轨道 。 然 后 把 3 号 车 厢 从 万 1 移 到 
出 轨道 ， 接 着 把 4 号 车 厢 从 2 移 到 出 轨道 。 至 此 ， 没 有 可 以 立即 进入 出 轨道 的 车 厢 了 。 

接 下 来 要 进入 缓冲 站 的 是 8 号 车 ， 它 被 调 人 Hl。 然后 是 5 号 车 厢 ， 它 从 人 轨道 直接 进入 
出 轨道 。 然 后 依次 把 6 号 、7 号、8 号 和 9 号 车 胡 从 它们 所 在 的 缓冲 轨道 移 到 出 轨道 。 

初始 排列 如 图 8-6a 所 示 的 车 厢 ， 只 需 三 个 缓冲 轨道 就 可 以 进行 车 厢 重 排 ， 而 按照 其 他 初 
始 顺序 排列 的 车 厢 ， 可 能 需要 更 多 的 缓冲 轨道 才能 重 排 。 例 如 ， 初 始 排列 为 1，m，7m-1，…， 
2 的 车 厢 需 要 n-1 个 缓冲 轨道 。 

3. C++ 实现 

用 个 数组 栈 来 表示 个 缓冲 轨道 。 之 所 以 使 用 数组 栈 ， 是 因为 它 比 链 栈 要 快 。 程 序 8-9 
是 我 们 要 使 用 的 全 局 变量 。 


程序 8-9 ”列车 车 厢 重 排 程 序 的 全 局 变量 


arrayStack<int> *track; /缓冲 轨道 数组 

int numberOfCars; 

int numberOfTracks; 

int smallestCar; /在 缓冲 轨道 中 编号 最 小 的 车 大 
int itsTrack; // 停 售 着 最 小 编号 车 厢 的 缓冲 轨道 








函数 railroad ( 见 程序 8-10 ) 计算 一 个 车 厢 的 移动 序列 ， 以 此 完成 车 厢 的 重 排 。 车 厢 初 始 
顺序 为 inputOrder[l:theNumberOfCars]， 绥 冲 轨道 最 多 为 theNumberOfTracks。 如 果 移 动 序列 
不 存在 ，railroad 的 返回 值 是 false， 否 则 是 true。 

函数 railroad 从 创建 栈 track 开始 ，track[i] 代表 缓 冲 轨 道 i, 1 < i=< numberOfTracks。 
for 循环 开始 时 ， 编 号 为 nextCarToOutput 的 车 厢 并 没有 在 缓冲 轨道 上 。 

在 for 循 环 的 第 i 次 迭代 中 ， 入 轨道 上 的 车 厢 inputOrder[i] 被 调 出 。 若 inputOrder[i]= 
nextCarToOutput， 则 该 车 采 直 接 被 移 到 出 轨道 ， 然 后 nextCarToOutput 的 值 增 1。 这 时 ， 绥 
冲 轨 道 可 能 有 若干 节 车 厢 可 以 进入 出 轨道 ， 把 这 些 车 厢 移 到 出 轨道 的 过 程 由 while 循环 完成 。 
如 果 车 厢 inputOrder[i] 不 能 移 到 出 轨道 ， 那 么 就 没有 车 有 厢 可 以 移 到 出 轨道 。 这 时 ,按照 已 经 
确定 的 轨道 分 配 规则 ， 把 车 有 厢 inputOrder[i] 移 到 一 个 缓冲 轨道 。 


程序 8-10 ”函数 railroad 
bool railroad(int inputOrder[], int theNumberOfCars, int theNumberOfTracks) 


{1/ 从 初始 顺序 开始 重 排 车 厢 
// 如果 重 排 成 功 ， 返回 true， 否则 返回 false 


numberOfCars = theNumberOfCars; 
numberOfTracks = theNumberOfTracks; 


/ 创建 用 于 缓冲 轨道 的 栈 


track = new arrayStack<int> [numberOfTracks + 1]; 


int nextCarToOutput = 1; 
smallestCar = numberOfCars + 1; // 缓冲 轨道 中 无 车 厦 


1/ 重 排 车 厢 


for (int i = 1; i <= numberOfCars; i++) 
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if (inputOorder[i] == nextCarToOutput) 
{// 将 车 晒 inputorder[i] 直接 移 到 出 轨道 
cout << "Move car " << inputOrder[i] 
<< " from inpuat track to output track” << ernidl; 
nextCarToOutput++; 


1/ 从 缓冲 轨道 移 到 出 轨道 
while (smallestCar == nextCarToOutput) 
{ 
outputFromHoldingTrack (); 
nextCarToOutput++; 


} 
else 
/将 车 厢 inputOrder[i] 移 到 一 个 缓冲 轨道 
计生 (!PutInHoldingTrack (inputOrder[i])) 
return false; 


return true; 


程序 8-11 和 程序 8-12 分 别 给 出 函数 railroad 中 所 调用 的 函数 outputFromHoldingTrack 和 
putInHoldingTrack。 函 数 outputFromHoldingTrack 用 于 把 一 节 车 厢 从 缓冲 轨道 移 到 出 轨道 ， 而 
且 修 改 smallestCar 和 itsTrack 的 值 。 函 数 putInHoldingTrack 根据 车 厢 分 配 规则 把 车 厢 c 移 到 
某 个 缓冲 轨道 ， 它 也 修改 smallestCar 和 itsTrack 的 值 。 


程序 8-11 函数 outputFromHoldingTrack 


void outpPutEFromHoldingTrack() 


{1/ 将 编号 最 小 的 车 厢 从 缓冲 轨道 移 到 出 轨道 


/从 栈 itsTrack 中 删除 编号 最 小 的 车 厢 
track[itsTrack] .pop(); 
Cout << "Move car " << smallestCar << " from holding " 
<< "track " << itsTrack << " to output trackn" << endl; 


1/ 检查 所 有 栈 的 栈 顶 ， 寻 找 编号 最 小 的 车 参 和 它 所 属 的 栈 itsTrack 
smallestCar = numberOfCars + 27 
for (int i = 1; i <= numberOfTracks; i++) 
if (!track[i] .empty() && (track[i] .top() < smallestCar)) 
{ 
smallestCar = track[il].top(); 
itsTrack = i; 


程序 8-12 ”函数 putlnHoldingTrack 
bool putInHoldingTrack (int c) 
{1/ 将 车 厢 c 移 到 一 个 缓冲 轨道 。 返 回 false， 当 且 仅 当 没有 可 用 的 缓冲 轨道 


1/ 为 车 厢 c 寻找 最 适合 的 缓冲 轨道 
/ 初始 化 
int bestTrack = 0， 1/ 目前 最 合适 的 缓冲 轨道 
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bestTop = numberOfCars + 1; // 取 bestTrack 中 顶部 的 车 采 
1/ 扫描 缓冲 轨道 
for (int i = 1; i <= numberOfTracks; i++) 


if {(!track[i] .empty()) 
{1/ 缓冲 轨道 i 不 空 
int toBCar = tracklil] top(): 
if (c < topCar && topCar < bestTop) 
{W 缓冲 轨道 i 的 栈 顶 具有 编号 更 小 的 车 厢 
bestTop = topCar; 
bestTrack = i; 
} 
} 
else /1/ 缓冲 轨道 i 为 空 
if (bestTrack == 0) bestTrack = i; 


if (bestTrack == 0) return false; 1/ 没有 可 用 的 缓冲 轨道 


/1/ 把 车 朋 c 移 到 轨道 bestTrack 

track[bestTrack] .push (c); 

cout << "Move car " << ¢c << " from input track " 
<< "to holding track " << bestTrack << endl; 


// 如 果 需 要 ， 更 新 smallestCar 和 itsTrack 
if {c < smallestCar) 


{ 
smallestCar = C7 


itsTrack = bestTrack; 
} 


return trues 


} 


4. 复杂 度 

为 了 计算 程序 8-10 的 时 间 复 杂 度 ， 我 们 首先 注意 , outputFromHoldingTrack 和 putInHoldingTrack 
的 复杂 度 均 为 OnumberOfTracks)。 在 railroad 中 ，while 循环 最 多 把 numberOfCars-1 节 车 厢 调 
出 , else 语句 最 多 把 numberOfCars-1 节 车 厢 移 到 缓冲 轨道 因此， 函数 outputFromHoldingTrack 
和 putInHoldingTrack 所 消耗 的 总 时 间 为 O(numberOfTracks*numberOfCars)。 在 railroad 
中 ，for 循环 语句 的 其 余部 分 需 耗 时 @(numberOfCars)。 所 以 ， 程 序 8-10 总 的 时 间 复 杂 度 为 
OnumberOfTracks*numberOfCars)。 如 果 使 用 一 个 平衡 二 又 搜索 树 ( 例如 AVL 树 ) 来 存储 缓冲 
轨道 顶部 的 车 月 编号 ( 见 第 15 章 )， 那 么 程序 的 复杂 度 可 以 降 至 O(numberOfCars*log(number 
OfTracks))。 这 个 时 候 ， 可 重 写 函数 outputFromHoldingTrack 和 putInHoldingTrack， 使 其 复杂 度 
为 OUogCumberOfTracks))。 在 这 个 应 用 中 ， 仅 当 numberOfTracks 很 大 时 ， 才 推荐 使 用 平衡 
二 叉 搜 索 树 。 


8.5.4 开关 盒 布线 


1. 问题 描述 
在 开关 盒 布 线 问 题 中 ， 给 定 一 个 矩形 布线 区 域 ， 其 外 围 有 若干 管 脚 。 两 个 管 脚 之 间 通 过 
布设 一 条 金属 线路 来 连接 。 这 条 金属 线路 称 为 电线 ， 它 被 限制 在 矩形 区 域内 。 两 条 电线 交叉 
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会 发 生 电 流 和 短路。 因此， 电线 不 许 交 叉 。 每 对 要 连接 的 管 脚 称 为 一 个 网 组 。 对 于 给 定 的 一 些 
网 组 ,我们 需要 确定 ， 它 们 能 否 连 接 而 又 不 发 生 交 叉 。 图 8-8a 是 一 个 布线 的 示例 ， 其 中 有 8 
个 管 脚 和 4 个 网 组 。 四 个 网 组 分 别 是 (1,4), (2, 3), (5, 6) 和 (7，8)。 图 8-8b 的 布线 
在 网 组 (1,，4) 和 (2，3 ) 之 间 有 交叉 ,而 图 8-8c 的 布线 没有 交叉 。 因 为 这 4 个 网 组 的 布线 
可 以 没有 交叉 ， 所 以 这 个 开关 盒 称 为 可 布线 开关 盒 ( routable switch box )。( 在 现实 问题 中 ， 
两 个 相 邻 的 电线 之 间 还 要 求 保留 一 个 最 小 的 间 际 ,但 是 我 们 忽略 这 个 额外 的 要 求 。) 我 们 的 问 
题 是 ,输入 一 个 开关 盒 布 线 实例 ， 然 后 确定 它 是 否 可 以 布线 。 




















1 之 和 1 2 
8 8 |3 "| 3 
7 | 布线 区 域 7 站 7 
4 5 
6 6 We 
5 5 5 
a) b) c) 


图 8-8 ”开关 盒 布线 示例 


图 8-8b 和 图 8-8c 的 电线 都 是 与 x 轴 和 yy 轴 平 行 的 直线 段 , 但 与 轴 不 平行 的 直线 段 或 曲线 
段 也 是 可 以 的 。 

2. 求解 策略 

为 了 解决 开关 盒 布线 问题 ,我们 注意 到 ， 当 一 个 网 组 互 连 时 ， 连 线 把 布线 区 域 分 隔 成 两 
个 分 区 。 分 区 边界 上 的 管 脚 属于 哪 一 个 分 区 与 连 线 无 关 ， 而 与 互连网 组 的 管 脚 有 关 。 例 如 ， 
当 网 组 (1, 4) 互 连 时 ,就 有 两 个 分 区 。 一 个 分 区 包含 管 脚 2 和 3， 男 一 个 分 区 包含 管 脚 
5 ~ 8。 现 在 如 果 有 一 个 网 组 ， 其 两 个 管 脚 分 别 属 于 两 个 不 同 的 分 区 ， 那 么 这 个 网 组 是 不 可 布 
线 的 ， 进 而 整个 开关 盒 布 线 实例 也 是 不 可 布线 的 。 如 果 没 有 出 现 这 样 的 网 组 ， 那 么 我 们 就 可 
以 根据 连 线 不 能 跨 区 的 原则 ， 对 每 个 分 区 是 否 可 独立 布线 的 问题 做 出 判断 。 如 果 从 一 个 分 区 
中 选择 一 个 网 组 ， 这 个 网 组 把 其 所 属 分 区 分 成 两 个 子 分 区 ， 而 其 余 任 一 个 网 组 的 两 个 管 脚 都 
分 属 不 同 的 子 分 区 ， 那 么 就 可 以 判断 ， 这 个 分 区 是 可 布线 的 。 

为 了 实现 这 个 策略 ， 可 以 从 任意 一 个 管 脚 开始 ， 按 顺 时 针 或 逆 时 针 方 向 沿 着 开关 盒 的 边 
界 进行 遍历 。 如 果 从 管 脚 1 开始 沿 顺 时 针 方向 遍历 图 8-8a 的 管 脚 ， 那 么 遍历 的 管 脚 顺序 是 1， 
2，…，8。 管 脚 1 和 4 是 一 个 网 组 ， 于 是 管 脚 1 至 4 之 间 出 现 的 所 有 管 脚 构成 第 一 个 分 区 ， 
管 脚 4 至 1 之 间 出 现 的 所 有 管 脚 构成 另 一 个 分 区 。 把 管 脚 1 插入 栈 ， 然 后 继续 处 理 ， 直 到 管 
脚 4。 这 个 过 程 使 我 们 仅 在 处 理 完 一 个 分 区 之 后 才能 进入 下 一 个 分 区 。 下 一 个 是 管 脚 2， 它 
与 管 脚 3 是 一 个 网 组 ， 它 们 把 当前 分 区 分 成 两 个 分 区 。 与 前 面 的 做 法 一 样 ， 把 管 脚 2 插入 栈 ， 
然后 继续 处 理 ， 直 到 管 脚 3。 由 于 管 脚 3 和 管 脚 2 是 一 个 网 组 ， 而 管 脚 2 正 处 在 栈 顶 ， 因 此 这 
表明 已 经 处 理 完 一 个 分 区 ， 可 将 管 脚 2 从 栈 顶 删除 。 接 下 来 将 遇 到 管 脚 4， 而 与 它 同 是 一 个 网 
组 的 管 脚 1 正 处 在 栈 项 。 现 在 ， 对 一 个 分 区 的 处 理 已 经 完毕 ， 可 从 栈 顶 删除 管 脚 1。 按 照 这 种 
方法 继续 下 去 ， 我 们 可 以 完成 对 所 有 分 区 的 处 理 ， 而 且 当 8 个 管 脚 都 检查 之 后 ， 栈 为 空 。 

当 我 们 处 理 不 可 布线 的 开关 盒 时 ， 将 会 出 现 什 么 样 的 情况 呢 ? 假定 图 8-8a 的 网 组 是 ( 1， 
5), (2,3) (4,7) 和 (6, 8 )。 开 始 时 ， 管 脚 1 和 2 和 人 栈 。 当 检查 到 管 脚 3 时 ， 管 脚 2 出 栈 。 
下 一 个 是 管 脚 4， 因 为 它 与 栈 顶 的 管 脚 不 能 构成 一 个 网 组 ， 所 以 它 人 栈 。 当 检查 到 管 脚 5 时 ， 
它 也 人 栈 。 尽 管 已 经 扫描 到 管 脚 1 和 管 脚 5， 但 还 不 能 结束 由 这 两 个 管 脚 所 定义 的 第 一 个 分 





区 的 处 理 过 程 ， 因 为 管 脚 4 的 网 组 布线 将 不 得 不 跨越 这 个 分 区 的 边界 。 结 果 是 ， 当 检查 了 所 
有 的 管 脚 时 ， 栈 不 是 空 的 。 

3. C++ 实现 和 时 间 复 杂 度 

程序 8-13 给 出 了 实现 上 述 策略 的 C++ 程序 。 它 假设 管 脚 的 数目 己 知 ， 每 个 管 脚 都 对 应 
一 个 网 组 编号 。 对 于 图 8-8c 的 示例 ， 输 入 数组 net 的 值 是 [1, 2, 2, 1, 3, 3, 4, 4] 。 该 程序 的 复杂 
度 为 0(n)， 其 中 是 管 脚 的 数目 。 


程序 8-13 ”开关 盒 布 线 


bool checkBox (int net[]，int n) 

{/ 确定 开关 鲍 是 否 可 布线 

/数组 net[0..n-1] 管 脚 数组 ， 用 以 形成 网 组 
l/n 是 管 脚 个 数 


arrayStack<int>* s = new arrayStack<int>(n); 


1/ 按 顺 时 针 扫 措 网 组 


Eo (Ln EB 三 0 工交 BB; t+ 丰 》 
1/ 处 理 管 脚 霸 
if (!s->empty()) 
// 检查 酰 的 顶部 管 脚 
if (net[i] == net[s->top()]) 
1/ 管 脚 net[i] 是 可 布线 的 ， 从 栈 中 删除 
s->pop () 


else S->push(i)， 
else s->push (i); 


1/ 是 否 有 剩余 的 不 可 布线 的 管 脚 

if {(s->empty()) 

{1/ 没有 剩余 的 管 肢 
cout << "Switch box is routable" << endl; 
return 廿 ZUe7 


} 


COUL << "Switch box is not routable" << endl; 
return false; 


8.5.5 ”离线 等 价 类 问题 


1. 问题 描述 

离线 等 价 类 问题 的 定义 见 6.5.4 节 。 这 个 问题 的 输入 是 元 素数 目 n、 关 系 对 数目 r 以 及 rx 
个 关系 对 。 目 标 是 把 n 个 元 素 划 分 为 等 价 类 ，。 

2. 求解 策略 

求解 分 为 两 个 阶段 。 在 第 一 个 阶段 ,我 们 输入 数据 ， 建 立 n 个 表 以 表示 关系 对 。 对 每 一 
个 关系 对 (i, 让，i 放 在 list[ 站 ,jj 放 在 list[i]。 

例 8-3 假定 n=9, r=11， 且 11 个 关系 对 是 (1,5), (1.6),， (3,7), (4,8),， (5,2),，(6,5)，(4.9)， 
(9,7)，(7,8)，(3,4)，(6.2)。9 个 表 是 

list[1]=[5,6] 
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list[2]=[5,6] 
list[3]=[7,4] 
List[4]=[8,9,3] 
List[5]=[1,2,6] 
List[6]=[1,2,5] 
List[7]=[3,9,8] 
List[8]=[4,7] 
List[9]=[4,7] 
表 中 元 素 的 顺序 不 重要 。 团 

在 第 二 个 阶段 是 寻找 等 价 类 。 为 寻找 一 个 等 价 类 ， 首 先 要 找到 该 等 价 类 中 第 一 个 没有 
输出 的 元 素 。 这 个 元 素 作 为 该 等 价 类 的 种 子 。 该 种 子 作为 等 价 类 的 第 一 个 成 员 输 出 。 从 这 个 
种 子 开 始 ， 我 们 找 出 该 等 价 类 的 所 有 其 他 成 员 。 种 子 被 加 到 一 个 表 unprocessedList 中 。 从 表 
unprocessedLis 中 删除 一 个 元 素 i， 然 后 人 处理 表 At[ 丫 。Ast[ 中 所 有 元 素 和 种 子 同属 一 个 等 价 
类 ; 将 za 四 中 还 没有 作为 等 价 类 成 员 的 元 素 输出 ， 然 后 加 入 unprocessedList 中 。 这 是 一 个 
过 程 : 从 表 unprocessedLis 中 删除 一 个 元 素 i， 然 后 把 表 list[i] 中 还 没有 输出 的 元 素 输出 ， 并 
且 加 入 unprocessedList 中 。 这 个 过 程 持 续 进行 到 unprocessedList 为 空 。 这 时 我 们 就 找到 了 一 
个 等 价 类 ， 然 后 继续 寻找 下 一 个 等 价 类 的 种 子 。 

例 8-4 考虑 例 8-3- 令 1 是 第 一 个 种 子 ， 作 为 一 个 等 价 类 的 成 员 被 输出 ， 然 后 加 入 表 
unprocessedList 中 。 接 下 来 把 1 从 unprocessedList 中 删除 ， 然 后 处 理 list[1]。 元 素 5 和 6 属 
于 List[1]， 与 1 同属 一 个 等 价 类 ， 它们 被 输出 ， 然 后 加 入 unprocessedList 中 。 将 5 或 6 从 
unprocessedList 中 删除 ， 然 后 处 理 它 们 所 在 的 表 。 假 定 删 除 的 是 5。 考 察 list[5] 中 的 元 素 
1、2 和 6。 因 为 1 和 6 已 经 输出 ， 所 以 被 忽略 。 把 元 素 2 输 出 ， 然 后 加 入 unprocessedList 
中 。 当 unprocessedList 中 的 剩余 元 素 (6 和 2 ) 被 删除 和 处 理 ， 没 有 其 他 元 素 被 输出 或 加 入 
unprocessedList 时 ，unprocessedList 成 为 空 表 ， 这 时 我 们 便 找 到 了 一 个 等 价 类 。 

为 找到 男 一 个 等 价 类 ， 我们 要 寻找 一 个 种 子 ， 它 是 还 没有 输出 的 元 素 。 元 素 3 还 没有 输 
出 ， 因 此 可 以 作为 下 一 个 等 价 类 得 种 子 。 元 素 3、4、7、8 和 9 作为 这 个 等 价 类 的 元 素 被 输出 。 
这 时 不 再 有 种 子 ， 因 此 我 们 找到 了 所 有 等 价 类 。 男 

3. C++ 实现 

为 了 实现 上 述 算法 ， 我们 必须 选择 表 list 和 unprocessedList 的 描述 方法 。 表 list 上 的 操作 
是 插入 和 检查 所 有 元 素 。 因 为 元 素 在 list 中 的 插入 位 置 并 不 重要 ， 所 以 用 任何 线性 表 或 栈 来 
描述 都 可 以 。 选 择 的 标准 是 空间 和 时 间 性 能 最 优 。 

在 nn 个 表 list[1:n] 中 ， 元 素 总 数 为 2r。 所 以 ， 就 空间 需求 而 言 ， 数 组 线性 表 和 栈 类 需要 
的 空间 所 能 容纳 的 元 素 个 数 为 2r 和 47 ( 因为 数组 容量 加 倍 ， 所 以 数组 长 度 最 多 可 以 达到 数组 
元 素 个 数 的 两 倍 )。 链 表 类 需要 的 空间 要 能 容纳 27 个 元 素 和 2r 个 指针 。 我 们 对 线性 表 和 栈 的 
时 间 性 能 研究 ( 见 5.6 节 、6.1.6 节 、8.3.3 节 和 8.4.3 节 ) 表明 ， 这 些 结构 的 链表 实现 比 数组 
实现 要 慢 。 因此 ,我们 在 对 离线 等 价 类 问题 做 进一步 研究 时 ， 不 考虑 链表 表示 法 。 


”如 果 在 表 的 右 端 插入 新 元 素 ， 那 么 应 用 arrayList ( 见 5.3 节 ) 将 有 更 好 的 时 间 性 能 。 然 
而 ， 使 用 arrayStack 性 能 会 更 好 一 点 。 从 性 能 上 考虑 ， 线 性 表 unprocessedList 也 用 arrayStack 


程序 8-14 给 出 了 解决 离线 等 价 类 问题 的 C++ 程序 ， 它 由 两 部 分 组 成 。 在 程序 8-14 的 第 
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一 部 分 , 输入 n、r 和 +r 对 关系 ， 对 于 每 个 元 素 都 建立 了 一 个 相应 的 栈 。 栈 list[i] 对 应 元 素 i, 
它 包含 所 有 这 样 的 元 素 j : (i,j ) 或 (j,i) 是 输入 的 关系 对 。 如 果 通 过 检验 可 以 保证 对 每 一 个 
输入 对 (a.b), a 和 4b 都 属于 [1,h]， 那 么 代码 会 更 易 维 护 。 练 习 31 要 求 改进 代码 ， 增 加 对 
输入 关系 的 合法 性 检验 。 

程序 8-14 的 第 二 部 分 是 输出 等 价 类 。 其 中 使 用 了 数组 out， 而 且 out[i]=true， 当 和 且 仅 当 i 
已 经 作为 某 个 等 价 类 的 元 素 而 输出 。 栈 unprocessedList 辅助 寻找 一 个 等 价 类 的 所 有 元 素 。 这 
个 栈 中 的 元 素 都 作为 当前 等 价 类 的 元 素 被 输出 ， 并 且 用 来 寻找 当前 等 价 类 的 其 他 元 素 。 为 寻 
找 下 一 个 等 价 类 的 种 子 ， 我 们 扫描 数组 out 以 寻找 一 个 尚未 输出 的 元 素 。 如 果 没 有 这 样 的 元 
素 ， 就 没有 下 一 个 等 价 类 。 如 果 有 ， 则 开始 寻找 下 一 个 等 价 类 。 


程序 8-14 ”离线 等 价 类 程序 


int main() 
{ 
tt iy // 元素 个 数 
ry 1/ 关系 个 数 


cout << "Enter number of elements" << endl; 
Ln >» ns 
fF (mm 之 ) 
{ 
cout << "Too few elements" << endl; 
return 1; // 因 错 误 而 终止 


cout << "Enter number of relations" << endl; 
Cm S> Tr 
二 天 有) 
{ 
cout << "Too few relations" << endl; 
return 1; // 因 错 误 而 终止 
} 


// 建立 空 栈 组 成 的 数组 ，stack[0] 不 用 


arrayStack<int>* list = new arrayStack<int> [n+1]; 


/ 输入 工 个 关系 ， 存 储 在 表 中 
int a, b; /i (a，b) 是 一 个 关系 
for (int 2 = 1x 了 <= EF; 入 ++}) 
{ 
cout << "Enter next relation/pair" << endl; 
Ein 2 a > by 
list[a] .push (b); 
list[b] .push (a); 
} 


1/ 初始 化 以 输出 等 价 类 


arrayStack<int> unprocessedList; 


bool* out = new boolln + 1]; 
for (int i = 1; i <= n; i++) 
out[i] = false; 


// 输出 等 价 类 
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Eor (&nt 1 = ls LR A 下) 
主 《GE [i]} 
{/ 启动 一 个 新 类 
GUE << TNext class i155 了 < 1 < ~™™" 
out [i] = true; 


unprocessedList .push (i); 
/从 unprocessedList 中 取 类 的 剩余 元 素 
while (!unprocessedList.empty{)) 


{ 
int j = unprocessedList.top(); 
unprocessedList.pop()，; 


1// 表 1ist[j] 中 的 元 素 属于 同一 类 
whilie {!list[j] .empty()) 
{ 
int 可 = List!ij) .topit}? 
list[j] .pop(); 
if (!out[q]) /未 输出 
EOUE < 
out [9] = true; 
unprocessedList.push (gq); 


} 
} 
cout << endl; 
} 


cout << "End of Jist of equivalence classes" << endl; 


return 0; 
} 


4. 复杂 度 分 析 

为 了 分 析 等 价 类 程序 的 复杂 度 ， 我 们 假设 没有 异常 抛 出 。 程 序 第 一 部 分 用 时 @(n+ 门 。 
在 程序 的 第 二 部 分 ， 每 个 元 素 只 输出 一 次 ， 只 人 栈 unpdrocessedList 一 次 ， 只 从 栈 
unpdrocessedList 中 出 栈 一 次 ， 因 此 ， 入 栈 和 出 栈 操作 所 需要 的 总 时 间 为 9(n)。 最 后 ， 当 一 个 
元 素 j 从 栈 unpdrocessedList 中 出 栈 时 ，list[] 中 的 所 有 元 素 要 出 栈 接受 检查 。 每 个 list[] 中 的 
每 一 个 元 素 只 出 栈 一 次 。 所 以 ,在 所 有 list[1:n] 中 的 所 有 元 素 出 栈 接受 检查 所 需要 的 时 间 为 
BO(r) ( 注意， 在 输入 阶段 之 后 ， 所 有 list[1:n] 中 的 元 素 总 数 是 2*r )。 对 于 程序 8-14 的 总 时 间 
复杂 度 ， 如 果 考 虑 异常 ， 则 为 O(n+r)， 如 果 不 考 虑 异常 ， 则 为 @(n+7)。 

因为 解决 离线 等 价 类 问题 的 每 一 个 程序 对 每 一 个 关系 和 元 素 都 至 少 考 察 一 次 ， 所 以 用 时 
不 可 能 少 于 O(n+r)。 


8.5.6 ”迷宫 老鼠 


1. 问题 描述 

迷宫 ( 如 图 8-9 所 示 ) 是 一 个 矩形 区 域 ， 有 一 个 入 口 和 一 个 出 口 。 迷 宫 内 部 包含 不 能 穿 
越 的 墙壁 或 障碍 物 。 这 些 障 碍 物 沿 着 行 和 列 放置 ， 与 迷宫 的 边界 平行 。 迷 富 的 人 口 在 左上 角 ， 
出 口 在 右 下 角 。 














































































































假定 用 nx m 的 矩阵 来 描述 迷宫 ， 和 矩阵 的 位 置 (1，1) 表示 入 口 ，(n，m) 表示 出 口 ，n 和 
m 分 别 代表 迷宫 的 行 数 和 列 数 。 迷 富 的 每 个 位 置 都 可 用 其 行 号 和 列 号 表示 。 在 和 矩阵 中 ， 当 且 
仅 当 在 位 置 (i, 记 处 有 一 个 障碍 时 ， 其 值 为 1， 否 则 其 值 为 0。 图 8-10 给 出 了 图 8-9 中 的 迷宫 
所 对 应 的 矩阵 表示 。 迷 宫 老 鼠 (rat in a maze ) 问题 是 要 寻找 一 条 从 入 口 到 出 口 的 路 径 。 路 径 
是 一 个 由 位 置 组 成 的 序列 ， 每 一 个 位 置 都 没有 障碍 ， 而 且 除 入 口 之 外 ， 路 径 上 的 每 个 位 置 都 
是 前 一 个 位 置 在 东 、 南 、 西 或 北方 向 上 相 邻 的 一 个 位 置 ( 如 图 8-11 所 示 )。 
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图 8-10 ”用 和 矩阵 描述 的 图 8-9 的 迷宫 图 8-11 从 迷宫 任意 位 置 移动 一 步 时 的 4 种 方向 选择 


我 们 要 编写 程序 来 解决 迷宫 老鼠 问题 。 假 设 迷宫 是 一 个 方 阵 ( 即 m=n ) 有 旦 足够 小 ， 能 够 
整个 存储 在 目标 计算 机 的 内 存 中 。 程 序 应 是 独立 的 ,一 个 用 户 可 以 输入 自己 选择 的 迷宫 来 直 
接 寻 找 迷宫 路 径 。 

2. 设计 

我 们 将 采用 自 项 向 下 的 模块 化 方法 来 设计 这 个 程序 。 不 难 理解 ， 这 个 程序 有 三 个 部 分 : 
输入 迷宫 、 寻 找 路 径 和 输出 路 径 。 每 个 部 分 都 用 一 个 程序 模块 来 实现 。 还 有 一 部 分 用 于 显示 
欢迎 信息 、 软 件 名 称 及 作者 信息 ， 这 部 分 用 第 四 个 模块 来 实现 ， 这 个 模块 主要 是 为 了 增强 程 
序 界面 的 友好 性 ， 它 与 我 们 要 编写 的 程序 没有 任何 直接 关系 。 

寻找 路 径 的 模块 不 直接 与 用 户 打 交道 ， 因 此 没有 提供 帮助 机 制 ， 也 不 是 由 菜单 驱动 的 。 
其 他 三 个 模块 都 与 用 户 进行 交互 ， 因 此 应 多 花 一 些 精力 来 设计 用 户 接口 。 友 好 的 用 户 接口 能 
让 用 户 更 喜欢 你 的 程序 。 

首先 设计 欢迎 模块 。 我 们 希望 显示 如 下 信息 : 

Welcome To 
RAT IN A MAZE 
© Joe Bloe, 2000 
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如 果 觉 得 这 种 形式 有 些 单调 ， 那 么 可 以 利用 多 种 设计 手段 以 得 到 满意 的 效果 。 例 如 ， 文 
字 是 多 种 颜色 的 ， 每 行文 字 甚 至 每 个 字母 的 大 小 都 不 一 样 ， 字 符 按 一 定 的 时 间 间 隔 依次 出 现 ， 
间隔 可 以 很 小 。 还 可 以 使 用 声音 效果 。 信 息 显示 的 时 间 长 短 需要 确定 ， 显 示 的 时 间 应 足够 长 ， 
以 便 用 户 能 够 把 信息 读 完 ， 但 也 不 能 太 长 ， 以 至 于 用 户 打 哈欠 。 因 此 ， 欢 迎 信息 ( 乃至 整个 
用 户 接口 ) 的 设计 需要 很 高 的 艺术 技巧 。 

输入 模块 的 设计 需要 确定 ， 是 要 求 用 户 输入 一 个 由 0 和 1 组 成 的 抢 阵 好 呢 ? 还 是 显示 一 
个 矩阵 ， 然 后 让 用 户 使 用 鼠标 点 击 来 选 定 有 障碍 物 的 位 置 好 呢 ? 还 要 决定 使 用 什么 颜色 ， 是 
否 使 用 声响 ， 等 等 。 

输入 模块 的 设计 要 验证 迷宫 的 人 口 或 出 口 没 有 障碍 物 。 若 有 障碍 物 ， 则 不 存在 路 径 。 而 
用 户 很 有 可 能 输入 错误 的 数据 。 后 面 的 讨论 假定 输入 模块 已 经 通过 了 这 种 验证 ， 即 人 口 和 出 
口 没 有 障碍 物 。 

在 这 里 我 们 又 一 次 看 到 ， 如 果 要 设计 一 个 用 户 友好 的 接口 ， 那 么 最 初 看 上 去 很 简单 的 任 
务 ( 读 入 一 个 矩阵 ) 实际 上 是 很 复杂 的 。 

设计 输出 模块 时 需要 考虑 的 问题 基本 上 与 设计 输入 模块 时 的 一 样 。 

3. 程序 开发 计划 

设计 阶段 已 经 指出 需要 4 个 程序 模块 。 而 实际 上 还 需要 一 个 模块 ( 即 主 模块 ) 来 调用 这 
4 个 模块 ， 调 用 的 次 序 是 : 欢迎 模块 、 输 入 模块 、 寻 找 路 径 模 块 和 输出 模块 。 

程序 的 模块 结构 如 图 8-12 所 示 。 每 个 
模块 都 可 以 独立 编写 。 根 模块 被 编写 成 一 
个 main 方法， 欢迎 模块 、 输 入 模块 、 寻 

















找 路 径 模块 和 输出 模块 分 别 是 一 个 私有 ”| 次 名 输入 | | 寻找 路径 | | 输出 | 
方法 。 图 8-12 迷宫 老鼠 程序 的 模块 化 结构 
至 此 我 们 认识 到 ， 程 序 具 有 了 如 
图 8-13 所 示 的 形式 。 / 此 处 是 函数 weleome 
4 程序 开发 人 
数据 结构 和 算法 的 大 量 问题 仅仅 出 现在 /此 处 是 函数 outputPath 
寻找 路 径 模块 的 开发 过 程 中 。 因 此 ， 这 一 节 ER 
我 们 专门 开发 这 个 模块 。 其 他 模块 的 开发 放 a 
到 了 练习 33。 在 详细 设计 寻找 路 径 模块 的 inputMaze () ; 
代码 之 前 ， 我 们 先 给 出 图 8-14 所 示 的 C++ ee 
伪 码 。 对 这 段 代 码 ， 我 们 很 容易 判断 它 的 正 aas 
确 性 。 但 是 遗憾 的 是 ， 不 能 直接 在 计算 机 上 cout<< "No path "<<endl; 





使 用 这 种 形式 的 代码 ， 必 须 把 这 种 伪 码 细 化 


成 真正 的 C++ 代码 。 图 8-13 迷宫 老鼠 程序 的 形式 


在 细 化 图 8-14 的 伪 码 以 得 到 更 详尽 的 Dool Hodbath 
C++ 代码 之 前 ， 首 先 要 明白 如 何 寻 找 迷 宫 路 { 
径 。 首 先 把 迷宫 的 人 口 作为 当前 位 置 。 如 果 We 
当前 位 置 是 迷宫 出 口 ， 那么 已 经 找到 了 一 条 else return false; 





路 径 ， 寻找 工作 结束 。 如 果 当 前 位 置 不 是 迷 
富 出 口 ， 则 在 当前 位 置 上 放置 障碍 物 ， 以 阻 图 8-14 寻找 路 径 函 数 的 第 一 个 版 本 





止 寻找 过 程 又 绕 回 到 这 个 位 置 。 然 后 检查 相 邻 位 置 是 否 有 空闲 ( 即 没有 障碍 物 )， 如 果 有 ， 就 
移动 到 一 个 室 闲 的 相 邻 位 置 上 ， 然 后 从 这 个 位 置 开 始 寻找 通 往 出 口 的 路 径 。 如 果 不 成 功 ， 就 
选择 另 一 个 空闲 的 相 邻 位 置 ， 并 从 它 开 始 寻 找 通 往 出 口 的 路 径 。 为 了 方便 移动 ， 在 进入 新 的 
相 邻 位 置 之 前 ， 把 当前 位 置 保 存在 一 个 栈 中 。 如 果 所 有 空闲 的 相 邻 位 置 都 已 经 被 探索 过 ， 但 
还 未 能 找到 路 径 ， 则 表明 迷宫 不 存在 从 和 人口 到 出 口 的 路 径 。 
让 我 们 使 用 上 述 策略 来 考察 图 8-9 的 迷宫 。 首 先 把 位 置 (1，1 ) 插入 栈 ， 并 从 它 开 始 进 
行 寻 找 ， 移 到 与 它 相 邻 的 唯一 的 空闲 位 置 (2，1 )， 并 在 位 置 (1，1 ) 上 放置 障碍 物 ， 以 防止 
以 后 的 寻找 过 程 再 经 过 这 个 位 置 。 从 位 置 (2，1 ) 可 以 移动 到 (3，1 ) 或 (2，2 )。 假 定 移 动 
到 位 置 (3，1 )。 在 移动 之 前 ， 先 在 位 置 (2，1 ) 上 放置 障碍 物 并 将 (2，1 ) 插 人 栈 。 从 位 置 
(3，1 ) 可 以 移 到 (4， 1 ) 或 (3，2 )。 如 果 移 到 (4，1 )， 那 么 要 在 (3，1 ) 处 放置 障碍 物 ， 
并 把 (3, 1) 插入 栈 。 从 (4, 1 ) 依次 移动 到 (5, 1)、(6, 1)、(7, 1) 和 (8, 1)。 移 到 (8， 
1 ) 以 后 无 路 可 走 。 此 时 的 栈 包含 着 从 (1，1) 至 (8，1 ) 的 路 径 。 为 了 寻找 其 他 路 径 ， 从 栈 
中 删除 (8，1 )， 回 退 至 (7， 1 ),， 由 于 (7，1 ) 也 没有 新 的 空闲 的 相 邻 位 置 ， 因 此 从 栈 中 删 
除 位 置 (7，1 )， 回 退 至 (6，1 )。 按 照 这 种 方式 ， 一 直 要 回 退 到 (3，1 )， 然 后 才 可 以 继续 移 
动 ( 即 移动 到 (3，2 ))。 注 意 ， 在 栈 中 始终 有 一 条 从 人 口 到 当前 位 置 的 路 径 。 如 果 最 终 到 达 
了 出 口 ， 那 么 栈 中 的 路 径 就 是 从 人 口 到 出 口 的 路 径 。 
为 了 细 化 图 8-14， 我们 需要 把 迷宫 (一 个 0 和 1 的 矩阵 )、 迷 富 的 每 个 位 置 以 及 栈 都 表 
示 出 来 。 首 先 考虑 迷宫 。 迷 宣 一 般 被 描述 成 一 个 int 类 型 的 二 维 数组 maze。( 由 于 每 个 数组 
的 位 置 仅 有 0 或 1 两 种 取 值 ， 因 此 可 以 用 bool 型 二 维 数 组 ，true 代表 1，false 代表 0。 这 样 ， 
表示 迷 富 的 数组 空间 就 被 减少 了 。 ) 迷 宣 矩阵 的 位 置 (i，j ) 对 应 于 数组 maze 的 位 置 [i] 中 。 
从 迷宫 的 内 部 位 置 ( 非 边界 位 置 ) 开始 ， 有 4 种 可 能 的 移动 方向 : 右 、 下 、 左 和 上 。 从 
迷宫 的 边界 位 置 开始 ， 只 有 两 种 或 三 种 可 能 的 移动 方 1 
向 。 为 了 避免 在 处 理 内 部 位 置 和 边界 位 置 时 存在 差别 ，  ; 
可 以 在 迷宫 的 周围 增加 一 圈 障 碍 物 。 对 于 一 个 mxm 的 
数组 maze， 这 一 圈 障 碍 物 将 占据 数组 maze 的 第 0 行 、 - 0 
, 
1 
1 
1 


l t,t Hk 
1 
1 
1 
0 1 0 
1 
第 mt1 行 、 第 0 列 和 第 m+tl 列 (如 图 8-15 所 示 )。 . 
现在 ， 迷 宫 的 所 有 位 置 都 处 在 一 圈 障 碍 物 所 围 成 
的 边界 之 内 ， 从 迷宫 的 每 个 位 置 开始 ， 都 有 4 种 可 能 
的 移动 方向 ( 可 能 每 个 方向 都 有 障碍 物 )。 因 为 给 迷 宣 
围 上 了 一 圈 障 碍 物 ， 所 以 程序 不 再 需要 处 理 边界 条 件 ， 图 8-15 设 有 一 图 障碍 物 的 图 8-9 的 迷宫 
这 就 大 大 简化 了 代码 设计 。 这 种 简化 的 代价 是 迷宫 数组 的 空间 稍稍 增加 了 。 
每 个 迷宫 位 置 都 可 以 用 行 和 列 的 下 标 来 表示 ， 分 别称 为 迷宫 位 置 的 行 坐标 和 列 坐标 。 可 
以 定义 一 个 带 有 数据 成 员 row 和 col 的 类 position， 使 用 它 的 对 象 来 跟踪 记录 迷宫 位 置 。 用 数 
组 表示 栈 ， 栈 用 来 保存 从 入 口 到 当前 位 置 的 路 径 。 一 个 没有 障碍 物 的 mxm 迷宫 ， 最 长 的 路 
径 可 包含 mr 个 位 置 ( 如 图 8-16a 所 示 )。 
因为 路 径 包 含 的 位 置 没 均 不 相同 ， 而 且 迷 宫 仅 有 mr 个 位 置 ， 所 以 一 条 路 径 所 包含 的 位 置 
最 多 不 超过 nr?。 又 因为 路 径 的 最 后 一 个 位 置 不 必 存 储 到 栈 中 ， 所 以 在 栈 中 存储 的 位 置 最 多 是 
ne-1。 注 意 ， 在 一 个 没有 障碍 物 的 迷宫 中 ， 在 人 口 和 出 口 之 间 ， 总 有 一 条 最 多 包含 2m 个 位 
置 的 路 径 (例如 ， 见 图 8-16b )。 不 过 ， 我 们 现在 无 法 保证 寻找 路 径 的 程序 模块 能 够 找到 最 短 
路 径 。 
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图 8-16 没有 障碍 物 的 迷宫 路 径 
现在 可 以 来 细 化 图 8-14， 细 化 的 结果 见 图 8-17， 它 已 经 接近 了 C++ 程序 。 


bool findPath () 

{W 寻找 一 条 从 入 口 (1,1) 到 出 口 (mvm) 的 路 径 
初始 化 迷宫 四 周 的 围墙 
1/ 初始 化 变量 ， 以 记录 我 们 在 迷宫 的 当前 位 置 
here,. row=1; 
here.col=1; 


maze[1] [1]=1; /防止 返回 到 入 口 


1/ 寻找 通 向 出 口 的 路径 
while (不 是 出 口 ) do 
{ 
寻找 可 以 移动 的 下 一 步 ; 
if( 下 一 步 存在 ) 
{ 
把 下 一 步 的 位 署 压 进 路 径 栈 ; 
1// 走 到 下 一 步 ， 然 后 在 这 一 步 加 上 障碍 物 
here=neighbor; 
maze [here.row] [here.col]=1; 
} 
else 
{ 
/不 能 继续 往 下 走 ， 退 回 
if( 路 径 为 空 ) return false; 
退回 的 位 置 在 路 径 栈 的 顶部 ; 
} 
} 


return true; 





图 8-17 图 8-14 的 细 化 版 


现在 的 问题 是 ， 要 确定 从 位 置 here 开始 向 哪 一 个 相 邻 位 置 移动 。 如 果 用 一 种 系统 方式 来 
选择 ， 那 么 问题 就 简化 了 。 例 如 ， 首 先 尝试 向 右 移动 ， 然 后 向 下 和 向 左 ， 最 后 向 上 。 一 旦 选 
择 了 要 移动 的 位 置 ， 就 要 知道 该 位 置 的 坐标 。 而 利用 一 个 如 图 8-18 所 示 的 偏 移 量 表 ， 就 很 容 
易 计 算 这 些 坐 标 。 把 向 右 、 向 下 、 向 左 和 向 上 移动 分 别 表示 为 0、1、2 和 3。 在 图 8-18 的 表 中 ， 
offset[i.row 和 offset[i].col 分 别 是 从 当前 位 置 沿 方向 i 移动 到 下 一 个 相 邻 位 置 时 ，row 和 col 坐 
标的 增 量 。 例如， 如 果 当 前 位 置 是 (3，4 )， 则 其 右边 相 邻 位 置 的 行 坐 标 为 3+ offset[0].row=3， 
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列 坐标 为 4+offset[0].col=5。 





TI 
1 0 1 


右 








图 8-18 ” 偏 移 量 表 


为 了 不 重 蹈 已 经 走 过 的 位 置 ， 我 们 在 每 一 个 走 过 的 位 置 maze[li][] 上 设置 障碍 物 ( 即 令 
maze[filD]=1 )。 

把 上 述 细 化 工作 并 入 图 8-17 的 代码 中 ， 就 得 到 了 程序 8-15 的 C++ 代码 。 在 程序 8-15 的 
代码 中 ， 变 量 size 存储 着 迷宫 的 行 和 列 的 大 小 。 


程序 8-15 ”寻找 迷宫 路 径 的 代码 





bool findPath () 
{1/ 寻找 一 条 从 入 口 (1,1) 到 达 出 口 (size，size) 的 路 径 
/1/ 如 果 找 到 ， 返 回 true， 藻 则 返回 false 


path = new arrayStack<position>; 


/ 初始 化 偏 移 量 


position offset[4]; 


offset[0] .row = 0; offset[0] .col = 1; // 右 
offset[1] .row = 1; offset[1L].col = 0; 1/ 下 
offset[2] .row = 0; offset[2].col = -1; // 左 
offset[3] ,row = -17 offset[3] .col = 0; WA 
1/ 初始 化 迷宫 外 围 的 障碍 墙 
E65 (LNE EH = Or YE = Size + Tr Tt) 
{ 
maze[0] [i] = maze[size + 1][i] = 1; / 底部 和 顶部 
maze[i][0] = maze[li]j[size + 1] = 1; 1/ 诺 和 右 
} 
position here; 
here.row = 1; 
here.col = 1; 
maze[1] [1] = 1; // 防止 回 到 入 口 
int option = 0; 1/ 下 一 步 
int lastOption = 37 
/寻找 一 条 路 径 
while (here.row != size || here.col != size) 
{1/ 没有 到 达 出 口 


// 找到 要 移动 的 相 邻 的 一 步 

LAE: Ty GS 

while (option <= lastOption) 

{ 
r= here.row + offsetloption] .row; 
C = here.col + offset[option] .col; 
if (maze[r]j[c] == 0) break; 


OPLion+ 十 7 1/ 下 一 个 选择 
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W 相 邻 的 一 步 是 否 找到 ? 

if (option <= lastOption) 

{1/ 移 到 maze[r] [cl] 
path->push (here); 
here.row = r; 
here.col = ¢? 
maze[lr][c] = 1; 1// 设置 1， 以 防 重复 访问 
option = 0; 

} 

else 

{W/ 没有 邻近 的 一 步 可 走 ， 返 回 
if (path->empty()) 


return false; 1/ 没有 位 置 可 返回 
position next = path->top(); 
path->pop (); 
if (next.row == here.row) 
option = 2 + next.col - here.col; 
else option = 3 + next.row - here,.row’? 
here = next; 
} 
} 
return true; 1/ 到 达 出 口 


} 


函数 findPath 首先 创建 一 个 空 栈 。 然 后 对 偏 移 量 数组 进行 初始 化 ， 并 在 迷宫 周围 设置 一 
圈 障 碍 物 。 在 while 循环 中 ， 从 当前 位 置 here 出 发 ， 按 右 、 下 、 左 、 上 的 顺序 选择 下 一 个 移 
动 位 置 。 如 果 存 在 下 一 个 移动 位 置 ， 则 将 当前 位 置 搬入 栈 ， 然 后 移动 到 下 一 个 位 置 。 如 果 不 
存在 下 一 个 移动 位 置 ， 则 退回 到 前 一 个 位 置 。 如 果 无 路 可 退 ( 即 栈 为 空 )， 则 表明 不 存在 通 往 
出 口 的 路 径 。 如 果 可 以 退 ， 那么 当 退 到 栈 的 项 部 元 素 所 表示 的 位 置 (next ) 时 ， 就 从 next 和 
here 来 计算 下 一 个 移动 位 置 。 注 意 here 与 next 相 邻 。 实 际 上 ， 在 程序 前 面 某 一 时 刻 ， 我 们 从 
next 移 到 here， 而 且 是 最 后 一 次 移动 。 对 下 一 个 移动 位 置 的 选择 可 用 以 下 代码 来 实现 : 

if (next.IOow==here-zow) 


option=2+next.col-here.col; 
else option=3+next.row-here.row; 


现在 分 析 程 序 的 时 间 复 杂 度 。 在 最 坏 情况 下 ， 可 能 要 遍历 每 一 个 空闲 位 置 ， 而 每 个 空闲 
位 置 进 入 栈 的 机 会 最 多 有 3 次 。( 每 次 从 一 个 位 置 移动 时 ， 该 位 置 都 要 插入 栈 ， 而 从 任何 一 个 
位 置 开始 ， 最 多 有 3 种 移动 选择 。 ) 因而 每 个 位 置 从 栈 中 被 删除 的 机 会 也 最 多 有 3 次 。 在 每 个 
位 置 上 ， 检 查 相 邻 位 置 所 需要 的 时 间 是 B@(1)。 因 此 ， 程 序 的 时 间 复 杂 度 应 为 O(unblocked)， 
其 中 unblocked 是 迷宫 的 空闲 位 置 数 日 。 这 个 复杂 度 是 O(size”)= OU 。 

参看 16.8.4 节 你 会 发 现 ， 函 数 findPath 的 策略 实际 上 就 是 深度 优先 搜索 ， 它 是 更 一 般 的 
所 谓 回溯 策略 中 一 种 特殊 方法 。 因 此 ，findPath 是 深度 优先 搜索 、 回 滴 和 栈 的 应 用 。 


练习 


15. 编写 一 个 程序 判定 字 符 串 中 是 否 有 不 匹配 的 括号 ， 不许 使 用 栈 。 测 试 你 的 程序 。 计 算 时 
间 复 杂 度 。 

16. 编写 程序 8-6 的 另 一 个 版 本 ， 寻 找 匹 配 的 圆 括 号 和 匹配 的 方 括号 。 在 字符 串 (a+[b*(c- 
d)+ 人 ) 中 ， 匹 配 的 结果 是 (0,14)，(3,13)，(6,10) ; 在 字符 串 (a+[b*(c-d)+D) 中 ， 却 存在 一 个 











概 套 问题 : 位 置 6 的 左 圆 括号 应 该 在 其 后 的 右 方 括号 出 现 之 前 和 一 个 右 圆 括号 匹配 。 测 试 
你 的 代码 。 

对 一 个 包含 圆 插 号 、 方 插 号 和 花 括号 的 表达 式 完成 练习 16。 

. 对 4 个 碟子 的 汉 诺 塔 问题 ， 用 笔算 出 碟子 的 移动 序列 。 





19. 对 碟子 个 数 运用 归纳 法 ， 证 明 程 序 8-7 的 正确 性 。 
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ph 


. 假设 汉 诺 塔 中 的 碟子 按 1 ~ n 编号 ， 最 小 的 碟子 为 1 号 碟子 。 改 进程 序 8-7， 让 它 同 时 输 
出 被 移动 碟子 的 编号 。 只 需 简 单 地 改动 输出 语句 ， 不 要 做 其 他 改动 。 

. 编写 程序 8-8 中 的 showState 方法 ,假设 输出 设备 是 计算 机 屏幕 。 如 果 必 要 ， 可 以 给 类 
arrayStack 增加 方法 ,使 其 能 够 方便 地 访问 塔 上 的 碟子 。 需 要 添加 时 间 延 迟 ， 以 防 显 示 太 
快 而 看 不 清 。 不 同 的 碟子 用 不 同 的 颜色 显示 。 

. 哈哈 塔 与 汉 诺 塔 类 似 。 碟 子 从 1 ~ n 编号 ; 奇数 号 碟子 是 红色 ， 侦 数 号 碟子 是 黄色 。 碟 子 
最 初 在 1 号 塔 ， 从 顶 到 底 按 照 1 ~ n 堆放 。 碟 子 要 移 到 2 号 塔 ， 任 何 时 候 ， 同 色 的 矶 子 不 
能 上 下 挨 着 。 碟 子 的 最 后 次 序 和 最 初次 序 相同 。 

1 ) 编写 一 个 程序 ， 把 碟子 从 1 号 塔 移 到 2 号 塔 ， 可 以 用 3 号 塔 作为 中 转 站 。 
2 ) 你 的 程序 需要 碟子 移动 多 少 次 ? 

. 探讨 中 转 塔 个 数 记 1 时 的 汉 诺 塔 问题 。 使 用 更 多 的 塔 以 减少 碟子 移动 次 数 。 例 如 ， 当 中 转 
塔 的 个 数 是 n-1 的 时 候 ， 碟 子 移动 2n-1 次 就 够 了 。 我 们 的 探讨 可 以 从 两 个 中 转 塔 开始 。 
. 1 ) 一 个 转轨 站 有 3 个 后 进 先 出 的 缓冲 轨道 。 车 厢 的 初始 顺序 为 3，1，6，7，2，8，5，4。 

像 图 8-6 和 图 8-7 一 样 画 图 显示 ， 按 照 8.5.3 节 求 解 每 一 节 车 厢 移 动 之 后 ， 转 轨 站 、 
人 轨道 和 出 轨道 的 布局 。 
2 ) 假定 有 两 个 缓冲 轨道 ， 完 成 1 )。 

. 在 求解 列车 车 有 古 重 排 问题 时 ( 见 8.5.3 节 )， 用 大 个 数组 形式 的 栈 来 表示 大 个 缓冲 轨道 。 请 
问 每 个 栈 多 大 ?总 的 栈 空间 是 多 少 ? 

. 1 ) 采用 大 条 缓冲 铁轨 进行 车 厢 重 排 ， 程 序 8-10 总 能 成 功 吗 ? 

2 ) 车 厢 移 动 的 总 次 数 为 nt ( 车厢 移 动 到 一 条 缓冲 轨道 的 次 数 )。 假 定 对 初始 排列 的 车 厢 ， 
使 用 条 缓冲 轨道 和 程序 8-10 可 以 完成 车 厢 重 排 。 程 序 8-10 所 需要 的 移动 次 数 是 否 

是 最 少 的 ? 证 明 你 的 结论 。 

.假定 每 条 缓冲 轨道 了 最 多 容纳 s; 节 车 厢 ， 其 中 1 < i < k， 编 写 一 个 车 厢 重 排 程序 。 

.对 网 组 (1,6)，(2,5)，(3,4)，(7,10)，(8,9)，(12,13) 和 (11,14)， 应 用 程序 8-13。 在 检查 每 一 
个 管 脚 之 后 显示 栈 的 布局 。 

.在 开关 盒 布 线 问题 中 ， 当 同一 网 组 的 两 个 管 脚 都 进入 栈 的 时 候 ， 处 理 过 程 可 以 结束 。 编 写 
一 个 checkBox 的 新 版 本 以 完成 这 一 过 程 。 新 程序 的 时 间 复 杂 度 应 为 O(n)， 其 中 为 管 脚 
个 数 。 假 设 网 组 数量 是 1 ~ n/2。 需 要 多 大 的 栈 ? 

.求解 下 列 离线 等 价 类 问题 : 

1 ) 给 定 表 list[1:n]， 且 n=9, r=9， 关 系 对 是 (1.3)，(4.2)，(3,8)，(6,7)，(5,8)，(6,2)，(1,5)， 
(4,7)，(9,7)。 

2 ) 用 1) 的 表 熟 悉 一 下 求解 策略 的 第 二 阶段 。 利 用 例 8-4 解释 你 的 处 理 过 程 。 

.程序 8-14 对 输入 的 关系 没有 做 合法 性 检验 。 修 改 这 个 程序 ， 确 保 输 入 的 每 一 对 a 和 b 都 

在 范围 [1,n] 之 中 ， 香 则 抛 出 类 型 为 myInputException 的 异常 。 





32. 1 ) 修改 程序 8-14， 使 list[] 成 为 arrayList 型 数组 ， 而 非 arrayStack 型 数组 。 使 用 线性 表 迭 
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代 器 ， 在 程序 的 第 二 阶段 检查 线性 表 的 元 素 。 
2 ) 通过 实验 来 比较 程序 修改 前 后 的 性 能 。 





33. 完成 迷宫 程 序 的 代码 设计 。 编 写 一 个 令 人 偷 快 的 C++ 程序 ， 它 包含 下 列 内 容 : 
1 ) 编写 一 个 welcome 也 数 ， 它 融 汇 了 图 像 和 声音 。 
2 ) 编写 一 个 不 易 出 错 的 inputMaze 函数 ， 它 包含 对 输入 数据 的 合法 性 检验 。 还 包含 输入 
3 ) 编写 一 个 outputPath 也 数 ， 输 出 从 入 口 到 出 口 的 路 径 。 
使 用 迷宫 实例 来 测试 代码 。 

34. 修改 迷宫 程序 ， 使 老鼠 从 当前 位 置 可 以 向 北 、 东 北 、 东 、 东 南 、 南 、 西 南 、 西 和 西北 方向 
移动 到 一 个 相 邻 的 位 置 。 用 迷宫 实例 来 测试 修改 后 的 代码 。 

35. 对 栈 path 的 最 大 值 ， 给 出 一 个 比 m1 更 理想 的 上 限 。 

36. 在 迷宫 中 寻找 路 径 的 策略 实际 上 是 一 个 递归 策略 。 从 当前 位 置 寻 找 并 移动 到 一 个 相 邻 位 


置 ， 然 后 确定 从 这 个 相 邻 位 置 到 出 口 之 间 是 否 存在 一 条 路 径 。 如 果 存 在 一 条 路 径 ， 则 寻找 
过 程 结 束 ， 和 否则 ， 寻 找 并 移动 到 另 一 个 相 邻 位 置 。 采 用 递归 方法 寻找 迷宫 中 的 路 径 。 用 迷 
富 实例 来 测试 代码 。 

37. 在 本 书 网 站 上 学 习 迷 富 动 画 制作 。 

1 ) 把 启发 式 方法 写 和 人 迷 富 程序 ， 使 老鼠 更 聪明 地 选择 下 一 个 可 以 移 向 的 位 置 。 例 如 ， 老 
鼠 可 以 先 沿 着 迷宫 四 周 的 墙壁 寻找 漏洞 。 

2 ) 修改 程序 8-15， 以 吸收 启发 式 方法 。 

3 ) 测试 新 程序 。 

4 ) 比较 新 程序 和 程序 8-15 的 运行 时 间 性 能 。 

38. 已 知 整 型 数组 data[]， 计 算 男 一 个 整 型 数组 lastAsBig[]。 简 单 地 说 ，lastAsBig[i] 是 
处 于 datali] 左 面 其 值 不 小 于 data[li] 但 距离 datali] 最近 的 元 素 的 位 置 。 例 如 ， 如 果 
data[]=[6,2,3,1,7,5]， 那 么 lastAsBig[]=[-1,0,0,2,-1,4]。 简 单一 点 说 ，lastAsBig[i] 是 在 小 于 
i 的 j 中、 满足 data[j] = datafi] 的 最 大 j。 如 果 不 存在 这 样 的 j， 则 lastAsBig[i]=-1。 

lastAsBig 的 一 个 应 用 是 天 气 预报 。 仿 data[i] 表示 最 近 一 年 中 第 i 日 盖 恩 斯 维尔 的 最 
高 温度 。 如 果 lastAsBig[i]=-1， 表 明 这 一 年 开始 还 没有 温度 记录 。 当 lastAsBig[i] 关 -1 
时 ，lastAsBig[i] 是 这 一 年 达到 i 日 最 高 温 昌 离 i 日 最 近 的 日 子 。i-lastAsBig[i] 是 它 与 i 日 
相隔 的 天 数 。 
1 ) 给 出 lastAsBig 的 两 个 以 上 的 应 用 。 
2 ) 编写 一 个 方法 ， 它 使 用 一 个 栈 来 计算 lastAsBig。 其 时 间 复 杂 度 应 为 O( 数组 data 的 长 

度 )。 

3 ) 测试 你 的 代码 。 


8.6 参考 及 推荐 读物 


开关 盒 布 线 算法 选 自如 下 论文 : 

1) C. Hsu. General River Routing Algorithm. ACM/IEEE Design Automation Conference, 
578 ~ 583, 1983. 

2 ) R. Pinter. River-Routing: Methodology and Analysis. Third Caltech Conference on VLSI 1983, 3. 
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队 列 





概述 


队列 和 栈 一 样 ， 是 一 种 特殊 的 线性 表 。 队 列 的 插入 和 删除 操作 分 别 在 线性 表 的 两 端 进行 ， 
因此 ， 队 列 是 一 个 先进 先 出 (FIFO ) 的 线性 表 。 还 有 一 种 队列 是 优先 级 队列 ， 它 的 删除 操作 
是 按照 元 素 的 优先 级 顺序 进行 的 ， 我 们 在 第 12 章 研究 这 种 队列 。C++ 标准 模板 库 STL 的 队 
列 是 一 种 用 数组 描述 的 队列 数据 结构 ， 它 是 从 STL 的 双 端 队列 派生 的 。 本 章 练习 9 要 求 开 发 
一 种 用 数组 实现 的 双 端 队列 数据 结构 。 

尽管 队列 很 容易 从 第 5 章 和 第 6 章 的 线性 表 类 派生 ， 但 是 本 章 并 没有 这 样 做 。 为 了 执行 
时 的 效率 ， 我 们 把 队列 设计 成 一 个 基 类 ， 而 且 分 别 采用 数组 描述 和 链表 描述 。 

本 章 的 应 用 部 分 设计 了 4 个 队列 应 用 的 示范 程序 。 第 一 个 应 用 是 关于 火车 车 厢 重 排 问 题 ， 
它 最 初 是 在 8.5.3 节 中 介绍 的 。 本 章 在 这 个 问题 上 做 了 修改 ， 要 求 缓冲 轨道 按照 FIFO 方式 而 
不 是 LIFO 方式 工作 。 第 二 个 应 用 是 寻找 两 个 定点 之 间 最 短线 路 的 经 典 Lee 算法 。 这 个 应 用 
可 以 看 成 是 8.5.6 节 的 迷宫 问题 的 一 种 变形 ， 它 寻找 从 迷宫 入 口 到 迷宫 出 口 的 最 短路 径 。 而 
8.5.6 节 的 代码 并 不 保证 能 够 找到 一 条 最 短 的 路 径 ， 它 只 保证 ， 如 果 存 在 一 条 从 入 口 到 出 口 的 
路 径 ， 则 一 定 能 找到 这 条 路 径 ( 没有 限定 长 度 )。 第 三 个 应 用 是 机 费 视 觉 领域 的 二 值 图 像 的 像 
素 识 别 ， 两 个 像素 具有 相同 的 标志 ， 当 且 仅 当 它们 属于 同一 个 图 元 。 最 后 一 个 应 用 是 工厂 仿 
真 程序 。 工 厂 有 若干 台 机 器 ， 每 台 机 器 能 够 执行 一 道 不 同 的 工序 。 工 厂 的 每 一 项 任务 都 由 一 
个 或 多 个 工序 组 成 。 我 们 给 出 了 一 个 程序 来 仿真 在 工厂 中 的 任务 流 。 该 程序 能 够 确定 每 项 任 
务 在 每 台 机 器 上 总 的 等 待 时 间 和 总 的 等 竺 时间。 这 些 信息 能 够 用 来 改进 工厂 的 设计 。 虽 然 本 
章 的 工厂 仿真 程序 使 用 的 是 FIFO 队列 ,但 是 现实 的 工厂 可 能 有 一 部 分 或 全 部 需要 优先 级 队 
列 。 在 后 续 章 节 中 将 介绍 其 他 几 种 队列 的 应 用 。 





9.1 定义 和 应 用 


定义 9-1 队列 (queue ) 是 一 个 线性 表 ， 其 插入 和 删除 操作 分 别 在 表 的 不 同 端 进行 。 插 
入 元 素 的 那 一 端 称 为 队 尾 (back 或 rear )， 删 除 元 素 的 那 一 端 称 为 队 首 (front )。 

一 个 三 元 素 的 队列 如 图 9-1a 所 示 。 从 中 删除 第 一 个 元 素 4 之 后 得 到 图 9-1b 所 示 的 队列 。 
如 果 向 图 9-1b 的 队列 中 插入 一 个 元 素 D， 必 须 把 它 插 在 元 素 C 的 后 面 。 插 入 元 素 D 以 后 的 结 
果 如 图 9-1c 所 示 。 


front back front back front back 
4 B CC BB B C DD 
a) b) © 


图 9-1 队列 举例 





队列 是 一 个 先进 先 出 ( FIFO ) 的 线性 表 ， 而 栈 是 一 个 后 进 先 出 (LIFO ) 的 线性 表 。 

例 9-1[ 现实 世界 的 队列 ] 

1 ) 虽然 自助 餐厅 的 盘子 是 按 LIFO 的 方式 摆 放 的 〈 见 例 8-1 ), 但 是 人 们 排队 选择 食物 时 
是 按照 FIFO 方式 进行 的 ， 顾客 结账 离开 的 顺序 与 进入 队伍 的 顺序 一 样 ， 这 便 是 队列 。 你 在 很 
多 情况 下 都 要 这 样 排队 一 一 在 商店 的 结账 台 ， 在 银行 的 服务 窗口 ， 在 洗车 场 ， 在 邮政 中 心 。 

2 ) 在 汽水 贩卖 机 里 ,口味 相同 的 汽水 放 在 一 起 出 售 ， 一 种 口味 占 一 栏 ， 一 听 压 着 一 听 。 
你 买 一 听 汽 水 ,贩卖 机 把 最 下 面 的 一 听 给 你 。 往 贩卖 机 里 添加 货物 时 ， 从 栏 的 顶部 添加 。 败 
卖 机 进货 取 货 的 方式 是 FIFO 的 ， 每 一 种 口味 的 汽水 是 一 个 队列 。 

3 ) 在 一 个 分 布 式 系统 中 ， 一 个 队列 要 为 多 个 队列 提供 服务 。 一 个 具有 m 个 服务 器 的 分 
布 式 系统 ， 具 有 m 个 服务 器 队列 ,一 个 队列 服务 于 一 个 服务 器。 男 外 ， 有 一 个 代理 人 队列 。 
服务 请 求 首先 进入 代理 人 队列 排队 ; 代理 人 按照 FIFO 方式 检查 代理 人 队列 中 的 服务 请 求 ， 然 
后 把 每 一 个 请 求 送 到 最 对 口 的 服务 器 队列 ; 服务 器 按照 FIFO 方式 处 理 来 自 服务 器 队列 的 服务 
请 求 。 下 面 是 两 个 具体 的 例子 。 

e 在 一 个 分 布 式 系统 中 ,计算 机 文件 在 文件 服务 器 上 复制 ， 以 提供 更 好 的 服务 。 一 

件 的 所 有 请 求 都 首先 进入 代理 人 队列 ; 代理 人 把 每 一 个 请 求 分 发 到 负载 最 小 的 服务 器 ， 


等 待 服务 器 处 理 。 
re 你 进入 到 一 个 代理 人 队列 。 当 
你 排 到 第 一 个 时 ， 一 个 志愿 者 根据 你 姓氏 的 第 一 个 字母 领 你 进入 一 个 服务 器 队列 。 在 


每 一 个 服务 加 取 基 的 前 关 是 一 小 击 悍 者 ， 他 档 才 你 的 年 谷 证 号 ， 汪 你 此 这 ， 二 后 内 
你 一 张 投票 卡 。 你 拿 着 投票 卡 进入 男 一 个 队列 ， 等 待 着 在 投票 卡 上 穿孔 ， 以 选择 你 喜 
欢 的 候选 人 。 区 


练习 


1. 下面 的 队列 操作 序列 从 一 个 空 队列 开始 : 加 入 半 、 加 入 了 ， 删除， 加 入 DP、 加 入 4、 删除 、 
加 入 7T、 加 入 4。 仿照 图 9-1 画 出 每 一 次 操作 之 后 的 队列 布局 。 

2. 在 现实 世界 中 找 出 另外 三 个 队列 应 用 的 实例 。 不 能 是 人 员 排 队 或 贩卖 机 之 类 的 队列 应 用 。 
可 以 是 有 人 参与 的 分 布 式 系 统 。 

3. 在 现实 世界 中 找 出 三 个 队列 和 栈 的 应 用 实例 ， 它 有 时 应 用 栈 ， 有 时 应 用 队列 。 例 如 ， 和 餐巾 
纸 机 。 有 的 餐巾 纸 机 的 工作 方式 像 栈 ， 而 有 的 像 队 列 。 

4. 在 8.5 节 的 应 用 实例 中 ， 哪 一 个 可 以 用 队列 代替 栈 而 又 不 影响 程序 的 正确 性 ? 


9.2 ”抽象 数据 类 型 


队列 的 抽象 数据 类 型 描述 见 ADT 9-1。 该 类 型 的 函数 名 称 和 C++ 的 STL 容器 类 队列 的 函 
数 名 称 相同 。 
程序 9-1 给 出 了 与 ADT 9-1 相对 应 的 C++ 抽象 类 。 


抽象 数据 类 型 queue 
{ 


实例 
元 素 的 有 序 表 ， 一 端 称 为 队 首 ， 另 一 端 称 为 队 尾 
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操作 





empity(): /返回 tue， 当 且 仅 当 队 列 为 空 ， 否 则 返回 false 
Size(); // 返回 队列 中 元 素 个 数 

front(); /返回 队列 头 元 素 

back(); /返回 队列 尾 元 素 

PoPO; // 删除 队列 首 元 素 

push(x): / 把 元 素 x 加 入 队 尾 





ADT 9-1 队列 的 抽象 数据 类 型 


程序 9-1 抽象 类 队列 


template<class T> 
class queue 
{ 
public: 
virtual ~queue() 1{} 
virtual bool empty() const = 0; 
/返回 true， 当 且 仅 当 队 列 为 空 
virtual :nt size() const = 0; 


/返回 队列 中 元 素 个 数 








virtual T& front() = 0)， 
/返回 头 元 素 的 引用 
virtual T& back() = 0; 
/返回 尾 元 素 的 引用 
Virtual void pop() = 0; 
/ 删除 首 元 素 
virtual void Push (const T& theElement) = 0; 
// 把 元 素 theElement 加 入 队 尾 
| 
9.3 ”数组 描述 
9.3.1 描述 
假定 采用 公式 (9-1 ) 把 队列 的 元 素 映射 到 一 个 数组 queue 中 。 


location(i)=i (9-1 ) 

这 个 公式 用 在 数组 描述 的 线性 表 和 栈 中 很 有 效 。 队 列 第 i 个 元 素 存 储 在 queue[i 中 ， 

1 三 0。 令 arrayLength 是 队列 queue 的 长 度 ， 令 queueFront 和 queueBack 分 别 表示 队 首 和 

队 尾 元 素 的 位 置 。 利 用 公式 (9-1 )，queueFront=0， 队 列 长 度 =queueBack+1。 在 队列 空 时 ， 
queueBack=-1。 使 用 公式 (9-1)， 图 9-1 的 队列 可 以 表示 成 图 9-2 的 形式 。 
































queueBack queueBack gqueueBack 
queueFront queueFront queueFront 
J 可 人 
AIBIC 5 B | a | B clD| “i | 
ed J = 过 
[0] [1] [2] [0] [1] [0] [1] [2] 
a) b) 6) 


图 9-2 用 公式 (9-1 ) 描述 的 图 9-1 的 队列 
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要 在 队列 中 插入 一 个 元 素 时 ， 先 将 queueBack 增 1， 然 后 把 新 元 素 插 到 queue[queueBack] 
中 。 这 意味 着 一 次 插入 操作 所 需要 的 时 间 为 9(1)。 要 删除 一 个 元 素 ， 必 须 把 位 置 1 至 位 置 
queueBack 上 的 元 素 左 移 一 个 位 置 。 删 除 一 个 元 素 所 需要 的 时 间 为 9(n)， 其 中 为 删除 之 后 
剩余 元 素 的 个 数 。 
如 果 不 采 用 公式 ( 9-1 )， 而 采用 下 面 的 公式 〈9-2 )， 那 么 删除 一 个 队列 元 素 所 需要 的 时 
间 将 减少 至 6(1)。 
location(i)=location( 队 首 元 素 )+i (9-2) 
使 用 公式 (9-2 )， 每 次 删除 一 个 队列 元 素 时 ， 不 需要 把 剩余 元 素 左 移 一 个 位 置 ， 只 需要 
简单 地 把 location ( 队 首 元 素 ) 加 1 即 可 。 图 9-3 给 出 了 用 公式 (9-2 ) 描述 图 9-1 队列 的 结 
果 。 注 意 ，queueFront=location ( 队 首 元 素 )，queueBack=location ( 队 尾 元 素 )， 队 列 为 空 时 ， 
queueBack<queueFront。 


queueBack queueBack queueBack 


Ed queueFront gqueueFront 





图 9-3 用 公式 (9-2 ) 描述 图 9-1 队列 的 结果 


如 图 9-3b 所 示 ， 每 次 删除 一 个 元 素 都 使 queueFront 右 移 一 个 位 置 。 因 此 ， 常 常会 有 这 样 
的 情况 ，queueBack=arrayLength-1 和 queueFront>0。 这 时 ， 队 列 的 元 素 个 数 小 于 数组 长 度 ， 
队列 左 端 还 有 放置 新 元 素 的 空间 。 为 了 可 以 继续 插入 元 素 ， 我们 可 以 把 队列 所 有 元 素 整 个 移 
到 队列 左 端 (如 图 9-4 所 示 )， 这 样 就 在 队列 的 右 端 腾 出 空间 。 这 种 移动 使 一 次 插入 操作 在 最 
坏 情况 下 的 时 间 复 杂 度 从 8@(1) 增 至 9(arrayLength)， 和 使 用 公式 ( 9-1 ) 的 结果 一 样 。 这 样 看 
来 ， 删 除 操作 的 效率 提高 了 ， 插 和 操作 的 效率 降低 了 。 


GueueFront queueBack queuerFront queueBack 
| EE ET et a | 
lhe lle 加 局 四 区 品 
dv 二 > | 
a) 移动 之 前 b) 移动 之 后 


图 9-4 ”队列 平移 


如 果 把 队列 的 两 端 环 接 ， 那么 ， 在 数组 长 度 不 变 的 情况 下 ,插入 和 删除 操作 的 最 坏 时 间 
复杂 度 均 可 变 成 6(1)。 这 时 ， 把 数组 视 为 一 个 环 ( 如 图 9-5 所 示 ) 而 不 是 一 条 直线 ( 如 图 9-4 
所 示 ) 会 更 方便 。 

把 数组 视 为 一 个 环 ， 每 一 个 位 置 都 有 其 下 一 个 位 置 和 前 一 个 位 置 。 位 置 arrayLength-1 的 
下 一 个 位 置 是 0， 而 0 的 前 一 个 位 置 是 arrayLength-1。 当 队列 尾 元 素 的 位 置 是 arrayLength-1 
时 ,下 一 个 元 素 的 插入 位 置 便 是 0。 用 环形 数组 来 表示 队列 的 方法 通过 下 面 的 公式 (9-3 ) 来 
实现 。 

location(i)=(location( 队列 首 元 素 )+i)%arrayLength (9-3 ) 
在 图 9-5 中 ， 我 们 改变 了 对 于 变量 queueFront 的 约定 。 现在 ， 它 沿 逆 时 针 方 向 ， 指 向 队 
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列 首 元 素 的 下 一 个 位 置 。 对 于 变量 queueBack 的 约定 不 变 。 这 种 改变 使 代码 简化 了 。 











theRear theRear theRear 
、 | 9 
~ fr 
a TS 
人 queueFront 
| 
queueFront queueFront 
a) 初始 b) 插入 c) 删除 


图 9-5 循环 队列 


向 图 9-5a 的 队列 搬入 一 个 元 素 ， 结 果 如 网 9-5b 所 示 。 从 图 9-5b 的 队列 删除 一 个 元 素 ， 
结果 如 图 9-5c 所 示 。 

当 且 仅 当 queueFront=queueBack 时 ， 队 列 为 空 。 初 始 条 件 queueFront=queueBack=0 定义 
了 一 个 初始 为 空 的 队列 。 如 果 向 图 9-$b 的 队列 插入 元 素 ， 直 到 数 
组 queue 的 元 素 个 数 等 于 数组 长 度 ( 即 队列 满 ) 为 止 ， 那 么 结果 
如 图 9-6 所 示 。 这 时 有 queueFront=queueBack， 与 队列 为 空 的 条 
件 完全 一 样 ! 这 样 我 们 无 法 判定 出 队列 是 空 还 是 满 。 为 了 避免 出 


现 这 种 问题 ， 队 列 不 能 插 满 。 在 向 队列 插入 一 个 元 素 之 前 ， 先 要 
判断 本 次 操作 是 否 会 使 队列 变 满 。 如 果 是 ,就 先 把 数组 长 度 加 售 ， 
然后 再 执行 插入 操作 。 使 用 这 种 策略 ， 队 列 元 素 个 数 最 多 是 
arrayLength—1。 


9.3.2 类 arrayQueue 


/A 
05 


We 
gqueueFront 


图 9-6 一 个 具有 arrayLength 


个 元 素 的 循环 队列 


类 arrayQueue 用 公式 (9-3 ) 把 队列 映射 到 一 个 一 维 数 组 。 数据 成 员 是 queueFront、 
queueBack 和 queue ; 除 插入 和 删除 操作 之 外 ， 所 有 方法 都 与 类 arrayStack 的 对 应 方法 相似 。 
这 些 相 似 的 代码 可 以 从 本 书 Web 网 站 得 到 。 程 序 9-2 的 方法 push 使 用 程序 9-3 中 定制 的 代码 


来 加 倍数 组 长 度 。 
程序 9-2 ”在 队列 中 插入 一 个 元 素 


template<class T> 
void arrayQueue<T>;:push (const Tg& theElement) 
{// 把 元 素 theg&lement 加 入 队列 


// 如 果 需 要 ， 则 增加 数组 长 度 
if ((theBack + 1) $ arrayLength == theFront) 
{// 加 倍数 组 长 度 
1/ 此 处 是 数组 长 度 加 倍 的 代码 
} 
// 把 元 素 theElement 插入 队列 的 昆 部 
GueueBack = (GueueBack + 1) 名 arrayLength; 
queue[queueBack] = theElement; 
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为 了 易于 想象 ， 当 给 环形 队列 的 数组 空间 长 度 加 倍 时 ， 最 好 还 是 把 图 9-7a 的 数组 拉 直 。 
这 个 图 的 队列 有 7 个 元 素 ， 数 组 长 度 是 8。 图 9-7b 是 队列 被 拉 直 以 后 的 样子 。 图 9-7c 显示 的 
是 利用 程序 changeLength1D ( 见 程序 5-2 ) 加 倍数 组 长 度 之 后 的 情况 。 





A queue [0] [1] [2] [BB] [4] [5] [6] [7 

NA A [eT5TalrTel TATs] 

eT gueueFront = 5, queueBack = 4 
b) 满 环形 队列 拉 直 以 后 


gqueueBack = 4 
queueFront = 5 


a) 满 环形 队列 


[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] C1] [12] [13] [14] [15] 


Pe | 


queueFront = 5, queueBack = 4 


c) 数组 加 倍 后 








[o] [1] [2] [3] [4] [5] [6] [7] [8] [9] [0] [11] [12] [13] [14] [15] 
[| 


queueFront = 13, queueBack = 4 


d) 第 2 段 元 素 移动 后 








[0 [1] [2] [3] [4] [5] [6] 名 Lo] DD [2] [3] [14] [15] 
a [| [||| 
queueFront = 15, queueBack = 6 


e) 改变 后 的 布局 








图 9-7 加 倍数 组 长 度 


为 了 得 到 合理 的 环形 队列 元 素 的 布局 ， 必 须 把 第 2 段 的 元 素 ( 即 A 和 B) 移 到 数组 的 右 
端 ， 如 图 9-7d 所 示 。 数 组 加 长 的 过 程 要 复制 arrayLength 个 元 素 ， 这 是 加 长 之 前 的 队列 容量 ， 
当 第 2 段 的 元 素 移 到 右 端 之 后 ， 总 共有 arrayLength-2 个 额外 元 素 要 复制 。 用 已 有 的 代码 ， 要 
复制 的 元 素 个 数 被 限制 在 arrayLength-1 个 。 图 9-7e 给 出 了 数组 加 长 之 后 ， 队 列 元 素 的 另外 
一 种 布局 。 这 个 布局 可 以 按照 下 面 的 步 又 得 到 : 
e 创建 一 个 新 的 数组 newQueue， 其 容量 加 倍 。 
e 把 第 2 段 的 元 素 ( 从 queue[queueFront+1] 到 queue[arrayLength-1] ) 复制 到 newQueue 
从 0 开始 的 位 置 。 
e 把 第 1 段 的 元 素 ( 从 queue[0] 到 queue[queueBack] ) 复制 到 newQueue 从 arrayLength- 
queueFront-1 开始 的 位 置 。 
通过 程序 9-3 得 到 的 是 图 9-7e 的 队列 元 素 布局 。 其 中 元 素 复 制 是 用 STL 的 复制 函数 完成 
的 。 程 序 9-4 是 队列 删除 的 代码 。 
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程序 9-3 ”数组 队列 长 度 加 信 
1/ 分 配 新 的 数组 空间 


T* newQueue = new T[2 * arrayLength]; 


1/ 把 原 数 组 元 素 复制 到 新 数组 


int start = (theFront + 1) $$ arrayLength; 
1 (start. & 2 
1/ 没有 形成 环 
Copy (queue + start, queue + start + arrayLength - 1, newQueue); 
else 
{ WU 队列 形成 环 


copy (Gueue + start, queue + arrayLength, newQueue); 
copy (queue, queue + theBack + 1, newQueue + arrayLength -= start); 


} 


1/ 设 置 新 队列 的 首 和 尾 的 元 素 位 置 

theFront = 2 * arrayLength -— 1; 

theBack = arrayLength - 2; /1/ 队列 长 度 arrayLength - 1 
arrayLength *= 2; 

delete[] queue; 





Gueue = newQueue; 
程序 9-4 ”从 队列 中 删除 一 个 元 素 
void pop() 
{1/ 删除 队列 首 元 素 
if (theFront == theBack) 
throw queueEmpty(); 
theFront = (theFront + 1) % arrayLength; 
queue[theFront] .~T(); // 给 了 析 构 


} 


队列 构造 函数 的 复杂 度 在 T 是 一 个 基本 数据 类 型 时 为 0(1)， 在 了 是 一 个 用 户 定义 的 类 型 
时 为 OfinitialCapacity)。 队 列 操作 函数 empty 、size 、front、back 和 pop 的 复杂 度 均 为 9(1) ; 
插入 函数 的 复杂 度 ， 在 队列 容量 不 加 倍 时 为 9(1)， 加 倍 时 为 9(queue size)。 根 据 定 理 5-1， 插 
入 操作 调用 m 次 ， 其 复杂 度 为 O(m)。 


练习 


5. 1 ) 扩充 队列 的 ADT， 增 加 以 下 函数 : 

i 输入 一 个 队列 。 

i 输出 一 个 队列 。 

iii 把 一 个 队列 分 解 成 两 个 新 队列 。 一 个 队列 包含 原 队 列 中 的 第 1、3、5、… 个 元 素 ， 另 
一 个 队列 包含 其 余 的 元 素 。 

iv 把 两 个 队列 合并 为 一 个 新 队列 。 从 队列 1 开始， 轮流 从 两 个 队列 选择 元 素 插入 新 队 
列 。 若 某 个 队列 空 了 ， 则 将 另 一 个 队列 中 的 剩余 元 素 插 人 新 队列 。 合 并 前 后 ， 每 一 个 
队列 的 元 素 其 相对 顺序 不 变 。 

2 ) 定义 一 个 抽象 类 extendedQueue， 它 派生 于 抽象 类 queue， 而 且 包含 与 1 ) 中 函数 对 应 的 
方法 。 
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3 ) 为 具体 的 类 extendedarrayQueue 编写 代码 ， 它 派生 于 类 arrayQueue 和 extendedQueue。 

4 ) 测试 你 的 代码 。 

设计 一 个 具体 的 类 slowArrayQueue， 它 派生 于 queue， 而 且 使 用 映射 公式 ( 9-2 )。 测 试 你 的 

代码 ， 并 与 arrayQueue 比较 性 能 。 

. 修改 类 arrayQueue 的 描述 方法 ， 使 得 一 个 队列 的 容量 与 数组 queue 的 大 小 相同 。 为 此 ， 用 
变量 queueSize 代替 变量 queueBack，queueSize 表示 队列 的 大 小 。 按 习惯 ， 队 列 首 元 素 是 
queue[queueFront]。 而 队列 尾 元 素 的 位 置 可 以 用 queueSize 和 queueFront 计算 出 来 。 测 试 修 
改 后 的 代码 。 

. 修改 类 arrayQueue 的 描述 方法 ， 使 得 一 个 队列 的 容量 与 数组 queue 的 大 小 相同 。 为 此 ， 
可 引入 另外 一 个 私有 成 员 lastOp 来 记录 最 后 一 次 队列 操作 。 如 果 最 后 一 次 队列 操作 是 
push， 则 队列 一 定 不 为 空 ; 如 果 最 后 一 次 队列 操作 是 pop， 则 队列 一 定 不 会 满 。 因 此 ， 当 
queueFront=queueBack 时 ，lastOp 可 以 用 来 区 分 队列 是 空 还 是 满 。 试 测 修改 后 的 代码 。 

9. 双 端 队列 ( deque ) 是 一 个 有 序 线性 表 ， 在 表 的 任何 一 端 可 以 插入 和 删除 操作 。 

1 ) 定义 双 端 队列 的 抽象 数据 类 型 。 要 求 包含 以 下 操作 : empty、size、front、back、push_ 
front、push_ back、 pop_front 和 pop_back。 
2 ) 定义 一 个 C++ 抽象 类 deque， 使 抽象 数据 类 型 deque 中 每 一 个 函数 都 在 该 抽象 类 中 有 对 
应 的 方法 。 
3 ) 用 公式 (9-3 ) 表示 一 个 双向 队列 。 设 计 一 个 具体 的 C++ 类 arrayDeque， 它 派生 于 
deque。 注 意 ，C++ 的 STL 中 的 类 deque 是 数据 结构 deque 的 数组 实现 。 
4 ) 用 适当 的 测试 数据 测试 你 的 代码 。 
10. 1 ) 设计 一 个 具体 的 类 dequeStack， 它 派生 于 stack( 见 程序 8-1 ) 和 arrayDeque( 见 练习 9 )。 
2 ) 计算 dequeStack 中 每 一 个 方法 的 时 间 复 杂 度 。 
3 ) 对 dequeStack 的 方法 和 arrayStack 的 对 应 方法 ， 做 预期 性 能 的 评价 。 
11. 1 ) 设计 一 个 具体 的 类 dequeQueue， 它 派生 于 queue( 见 程序 9-1 ) 和 arrayDeque( 见 练 习 9 )。 
2 ) 计算 dequeQueue 中 每 一 个 方法 的 时 间 复 杂 度 。 
3 ) 对 dequeQueue 的 方法 和 arrayQueue 的 对 应 方法 ， 做 预期 性 能 的 评价 。 


9.4 链表 描述 


队列 和 栈 一 样 ， 也 可 以 用 链表 来 表示 。 这 时 需要 两 个 变量 queueFront 和 queueBack 来 记 
录 队 列 两 端的 变化 ， 而 且 根 据 链接 的 方向 不 同 ， 有 两 种 记录 方式 : 从 头 到 尾 链 接 ( 如 图 9-8a 
所 示 ) 或 从 尾 到 头 ( 如 图 9-8b 所 示 )。 链 接 的 方向 不 同 ， 插 入 和 删除 操作 的 难 易 程度 也 不 同 。 


图 9-9 和 图 9-10 分 别 演 示 了 两 种 链接 模式 下 的 ee 
插入 和 删除 过 程 。 可 以 看 出 ， 两 种 链接 方向 都 适 |] 下 
合 于 插入 操作， 而 从 头 至 尾 的 链接 方向 更 便于 删 Ns pl A 
除 操作 。 因 此 ， 我 们 采用 从 头 至 尾 的 链接 方向 。 a) 

可 以 取 初 值 queueFront=queueBack=NULL， 
而 且 当 且 仅 当 队 列 为 空 时 ，queueFront=NULL。 | bn 
类 linkedQueue 可 以 定义 为 类 extendeChain ( 见 
程序 6-12 ) 的 一 个 派生 类 。 练 习 12 便 是 按照 这 “re b) 0 


种 方式 来 创建 linkedQueue 的 。 在 本 节 我 们 把 图 9-8 链 队 列 


和 


~ 


Co 
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linkedQueue 定义 为 一 个 基 类 。 
中 一举 -二 


theFront theBack -----4 


a) 向 图 9-8a 插 入 














本 1 
1 1 
上 
theFront theBack ----J 


b) 向 图 9-8b 插 入 
图 9-9 链 队 列 的 插入 操作 











NU 了 
theFront -一 一 一 theBack 
a) 从 图 9-8a 删 除 

TF 
上 外 ~ 
i NE 
theFront --—--- Becomes NULL theBack 
b) 从 图 9-8b 删 除 


图 9-10 链 队 列 的 删除 操作 


程序 9-5 给 出 了 链表 队列 的 插入 和 删除 方法 。 建 议 你 分 别 用 空 队 列 、 单 元 素 队 列 和 多 元 
素 队 列 来 运行 这 些 代 码 。 每 一 个 链 队列 方法 的 复杂 度 都 是 8(1)。 


程序 9-5 链 队列 中 的 插入 和 删除 方法 


template<class T> 
void linkedQueue<T>: :push (const T& theElement) 
{1/ 把 元 素 theElement 插 到 队 尾 


1/ 申请 新 元 素 节 点 


chainNode<T>* newNode = new chainNode<T> (theElement, NULL); 


/把 新 节点 插 到 队 昆 


if (GueueSize == 0) 


queueFront = newNode; 1/ 队列 空 
else 
queueBack->next = newNode; 1/ 队列 不 空 


GueueBack = newNode; 


queueSize+t+; 


} 


template<class T> 
void linkedQueue<T>: :pop!() 


{// 删除 首 元 素 
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if (aqueueFront == NULL) 
throw queueEmpty(); 


chainNode<T>* nextNode = queueFront->next; 
delete queueFront; 

queueFront = nextNode; 

queueSize-—; 


练习 


12. 


17. 
18. 


设计 类 linkedQueueFromExtendedChain， 它 是 派生 于 extendedChain ( 6.1.5 节 ) 和 queue 
的 一 个 链表 。 


. 用 链 队 列 来 完成 练习 5。 
.利用 push 和 pop 的 百 万 级 操作 序列 ( 即 先 执行 1 000 000 次 push 操作 ， 再 执行 1 000 000 


次 pop 操作 ) 来 比较 arrayQueue 和 linkedQueue 的 性 能 。 


. 在 某 些 栈 应 用 中 ， 要 插入 的 元 素 已 经 存储 在 类 型 为 chainNode 的 节点 中 。 对 此 ， 需 要 有 方 


法 pushNode(chainNode theNode) 把 节点 theNode 压 人 栈 ， 还 需要 有 方法 popNode 把 队列 

首 节点 删除 并 返回 。 

1 ) 编写 这 两 个 方法 的 代码 。 

2 ) 测试 代码 。 

3 ) 比较 push 和 pop 的 百 万 级 操作 序列 与 pushNode 和 popNode 的 百 万 级 操作 序列 的 运行 
时 间 。 


. 参看 练习 9 中 双 端 队列 的 定义 。 


1 ) 设计 一 个 具体 的 C++ 类 doublyLinkedDeque， 它 派生 于 练习 9 的 抽象 类 deque， 而 且 使 
用 了 一 个 双向 链表 。 你 设计 的 类 不 能 派生 于 其 他 的 类 。 

2 ) 你 设计 的 类 中 每 一 个 方法 的 时 间 复 杂 度 是 多 少 ? 

3 ) 使 用 适当 的 测试 数据 测试 你 的 代码 。 

使 用 单 向 链表 完成 练习 16。 类 的 名 称 为 linkedDeque。 

使 用 单 向 循环 链表 完成 练习 16。 类 的 名 称 为 circularDeque。 


9.5 ”应 用 
9.5.1 列车 车 厢 重 排 


1. 问题 描述 和 求解 策略 
下 面 我 们 重新 考察 8.5.3 节 的 列车 


车 采 重 排 问题 。 这 一 次 ， 位 于 入 轨道 “人 

和 出 轨道 之 间 的 缓冲 轨道 按照 FIFO 方 [581742963]  ， jp ， [987654321] 
式 运作 (如 图 9-11 所 示 )， 因 此 可 将 它 上 出 轨道 
们 视 为 队列 。 与 8.5.3 节 一 样 ， 禁 止 将 让 

车 厢 从 缓冲 轨道 移 到 入 轨道 ， 或 从 出 “ 


轨道 移 到 缓冲 轨道 。 所 有 的 车 厢 移 动 图 9-11 三 个 缓冲 轨道 示例 


沉 9 意 风 列 215 





都 要 按照 图 9-11 中 箭头 所 示 的 方向 进行 。 

第 条 轨道 Hk 可 直接 将 车 厢 从 人 轨道 移 到 出 轨道 。 其 余 入 1 条 轨道 用 来 缓存 不 能 直接 
进入 出 轨道 的 车 厢 。 

假定 有 9 节 车 厢 需 要 重 排 ， 其 初始 顺序 为 5,8,1,7,4,2,9,6,3。 假 设 好 3 ( 见 图 9-11 )。3 号 
车 厢 不 能 直接 进入 出 轨道 ， 因 为 1 号 车 厢 和 2 号 车 而 必 须 排 在 3 号 车 厢 之 前 。 因 此 ，3 号 车 厢 
进入 缓冲 轨道 H1。6 号 车 厢 可 进入 缓冲 轨道 81， 排 在 3 号 车 厅 之 后 ， 因 为 6 号 车 厢 是 在 3 号 
车 厢 之 后 进入 出 轨道 。9 号 车 厢 可 以 继续 进入 缓冲 轨道 H1， 排 在 6 号 车 胡 之 后 。2 号 车 厢 不 
可 排 在 9 号 车 有 厢 之 后 ， 因 为 它 必须 在 9 号 车 厢 之 前 进入 出 轨道 。 因 此 ，2 号 车 厢 进 入 缓冲 轨道 
52， 排 在 第 一 。4 号 车 厢 可 以 进入 缓冲 轨道 82， 排 在 2 号 车 厢 之 后 。7 号 车 厢 也 可 进入 缓冲 
轨道 52 ， 排 在 4 号 车 厢 之 后 。 这 时 ，!1 号 车 厢 可 通过 缓冲 轨道 83 直接 进入 出 轨道 。 接 下 来 ， 
2 号 车 厢 从 缓冲 轨道 82 进入 出 轨道 ; 3 号 车 厢 从 缓冲 轨道 Hl 进入 出 轨道 ; 4 号 车 厢 从 缓冲 轨 
道 瓦 2 进入 出 轨道 。 申 于 $ 号 车 厢 此 时 仍 在 人 轨道 上 ， 且 排 在 8 号 车 厢 之 后 ， 所 以 8 号 车 硒 
进入 缓冲 轨道 82， 这 样 5 号 车 厢 可 以 通过 缓冲 轨道 万 3 ， 直 接 从 人 轨道 进入 出 轨道 。 然 后 ，6 
号 、7 号 、8 号 和 9 号 车 厢 依 次 从 缓冲 轨道 进入 出 轨道 。 

当 一 节 车 厢 c 进入 缓冲 轨道 时 ， 依 据 如 下 的 原则 来 选择 缓冲 轨道 : 缓冲 轨道 上 已 有 的 车 
厢 其 编号 均 小 于 c; 如 果 有 多 个 缓冲 轨道 都 满足 这 一 条 件 ， 则 选择 左 端 车 厢 编 号 最 大 的 缓冲 轨 
道 ; 否则 选择 一 个 空 的 缓冲 轨道 (如果 有 的 话 )。 

2. 第 一 种 实现 方法 

实现 车 厢 重 排 算 法 的 程序 可 以 用 队列 表示 所 1 个 缓冲 轨道 。 可 以 模仿 程序 8-9 ~ 程序 
8-12 来 编码 。 程 序 9-6 和 程序 9-7 分 别 是 函数 outputFromHoldingTrack 和 putInHoldingTrack 
的 新 代码 。 对 于 程序 8-10 的 函数 railroad 应 做 以 下 修改 : 1 ) 缓冲 轨道 数量 减 1 ; 2 ) 轨道 的 
类 型 改 为 arrayQueue。 完 成 车 厢 重 排 所 需要 的 时 间 为 O(numberOfCars*k)。 借 助 AVL 树 ( 见 
第 15 章 )， 可 以 把 复杂 度 减 小 至 O(numberOfCars*logk)。 


程序 9-6 输出 车 厢 


void outputFromHoldingTrack () 
{ /将 编号 最 小 的 车 厅 从 缓冲 轨道 移 到 出 轨道 
/从 栈 itsTrack 中 删除 编号 最 小 的 车 三 
track[itsTrack] .pop (); 
Cout << "Move car " << smallestCar << ”from holding track ™ 





< LtSsTEdCk < ™ to GUtput track” < Bendls 


ns 寻找 编号 最 小 的 车 着 和 它 所 属 的 栈 
smallestCar = numberOfCars + 2;} 
for {int i = 1; i <= numberOfTracks; i++) 
if (!track[i] .empty() && track[il].front() < smallestCar) 
{ 
smallestCar = track[i] .front () 7 
itsTrack = 二; 


程序 9-7 把 车 厢 调 入 一 个 缓冲 轨道 


bool putIinHoldingTrack (int c) 


{// 将 车 厢 c 移 到 一 个 缓冲 轨道 。 返 回 false， 当 且 仅 当 没有 可 用 的 缓冲 轨道 


// 为 车 大 c 寻找 最 适合 的 缓冲 轨道 
/初始 化 


int bestTrack = 0, 1/ 目前 最 合适 的 缓冲 轨道 
bestLast = 0; // 取 jbestTrack 中 最 后 的 车 帅 

/ 扫描 缓冲 轨道 

for (int i = 1; i <= numberOfTracks; i++) 


if (!track[i] .empty!()) 
{1/ 缓冲 轨道 不 空 
int lastCar = track[i] .back(); 
if (CC > lastCar && lastCar > bestLast) 


{ 
// 缓冲 轨道 夺 的 妊 部 具有 编号 更 大 的 车 有 厢 
bestLast = lastCar; 
bestTrack = i; 
} 
} 
else /缓冲 轨道 i 为 空 
if (bestTrack == 0) 
bestTrack = i} 


if (bestTrack == 0) 
return false; /1/ 没有 可 用 的 缓冲 轨道 


// 把 车 厢 c 移 到 轨道 bestTrack 

track[bestTrack] .push (c)，; 

cout << "Move car " << C << " from input track " 
<< "to holding track " << bestTrack << endl; 


1/ 如 果 需 要 ， 更 新 smallestCar 和 itsTrack 
if (C< smallestCar) 


{ 
smallestCar = c; 
itsTrack = bestTrack; 
} 


return true; 


} 


3. 第 二 种 实现 方法 

为 了 驱动 车 明 重 排 算法 的 过 程 ， 第 一 种 实现 方法 中 的 队列 是 有 用 的 。 在 一 个 驱动 程序 中 ， 
一 条 缓冲 轨道 上 的 第 一 节 车 有 厢 移 出 之 后 ， 该 轨道 上 的 所 有 剩余 车 有 都 向 右 移动 一 个 位 置 。 做 
到 这 一 步 并 不 难 ， 因 为 缓冲 轨道 是 一 个 队列 。 

如 果 只 是 为 了 简单 地 输出 车 厢 重 排 过 程 中 所 有 必要 的 车 厢 移 动 顺序 ， 那 么 我 们 只 需要 知 
道 每 条 缓冲 轨道 队列 中 最 后 一 节 车 厢 的 号 码 ， 以 及 每 节 车 厢 当 前 所 在 的 轨道 即 可 。 如 果 绥 冲 
轨道 i 为 空 ， 则 令 lastCar[i]=0， 否 则 今 lastCar[i] 为 缓冲 轨道 i 中 最 后 一 节 车 厢 的 编号 。 如 果 
车 厢 i 位 于 入 轨道 ， 令 whichTrack[i]=0; 和 否则， 令 whichTrack 为 车 厢 丰 所 在 的 缓冲 轨道 。 起 始 
时 ，lastCar[ij=0，1 三 1 一 k，whichTrack[=0，1 和 ii ns, 使 用 这 些 变量 而 不 使 用 队列 ， 也 
可 以 得 到 第 一 种 实现 方法 的 结果 。 这 样 的 代码 可 在 本 书 网 站 上 的 文件 railroadWithNoQueues. 
'cpp 中 找到 。 





9.5.2 电路 布线 


1. 问题 描述 

在 8.5.6 节 的 迷宫 老鼠 问题 中 ， 可 以 寻找 从 迷宫 入 口 到 迷宫 出 口 的 一 条 最 短路 径 。 这 种 在 
网 格 中 寻找 最 短路 径 的 算法 有 许多 应 用 。 例 如 ， 在 电路 布线 问题 的 求解 中 ， 一 个 常用 的 方法 
就 是 在 布线 区 域 设置 网 格 ， 该 网 格 把 布线 区 域 划 分 成 nxm 个 方 格 ， 就 像 迷宫 一 样 (如 
图 9-12a 所 示 )。 一 条 线路 从 一 个 方 格 a 的 中 心 点 连接 到 男 一 个 方 格 b 的 中 心 点 ， 转 弯 处 可 以 
采用 直角 ， 如 图 9-12b 所 示 。 已 经 有 线路 经 过 的 方 格 被 “封锁 ”"， 成 为 下 一 条 线路 的 障碍 。 我 
们 希望 用 a 和 4。 之 间 的 最 短路 径 来 布线 ， 以 减少 信和 号 的 延迟 。 

2. 求解 策略 

在 下 面 的 讨论 中 ,我们 假设 你 对 = 人 
8.5.6 节 的 迷宫 求解 算法 已 经 很 熟悉 。a 
和 之 间 的 最 短路 径 需要 在 两 个 过 程 
中 确定 。 一 个 是 距离 标记 过 程 ， 另 一 | 
个 是 路 径 标 记过 程 。 在 距离 标记 过 程 = 十 一 
中 ， 先 从 位 置 a 开 始 ， 把 从 a 可 到 达 | 
的 相 邻 方 格 都 标记 为 1 ( 表示 与 a 相距 
为 1)， 然 后 把 从 编号 为 1 的 方 格 可 到 
达 的 相 邻 方 格 都 标记 为 2 ( 表示 与 a 相 
距 为 2 )。 这 个 标记 过 程 继 续 下 去 ， 直 
至 到 达 2 或 者 没有 可 到 达 的 相 邻 方 格 
为 止 。 图 9-13a 显示 了 这 种 搜索 过 程 的 
结果 ， 其 中 a=(3,2)，4b=(4,6)。 图 中 的 
阴影 部 分 是 被 封锁 的 方 格 。 

一 旦 到 达 b, 4b 的 编号 便 是 b 与 a 
之 间 的 距离 (在 图 9-13a 中 ，b5 上 的 标 
号 为 9)。 距离 标记 过 程 结束 之 后 ， 路 a) 距离 标记 b) 布线 路 径 。 
径 标 记过 程 开始 。 从 方 格 b 开 始 ， 首 图 9-13 电路 布线 
先 移动 到 一 个 其 编号 比 b 的 编号 小 1 
的 相 邻 方 格 上 。 在 图 9-13a 中 ， 我 们 从 b 移 到 方 格 (5,6)。 接 下 来 ， 从 方 格 (5,6) 移 到 比 当前 编 
号 小 1 的 相 邻 位 置 上 。 重 复 这 个 过 程 ， 直 至 到 达 a 为止。 在 图 9-13a 的 例子 中 ， 从 (5,6)， 然 
后 移 到 (6,6)、(6,5)、(6,4)、(5,4)， 等 等 。 图 9-13b 给 出 了 所 得 到 的 路 径 ， 它 是 (3,2) 和 (4,6) 
之 间 的 最 短路 径 。 注 意 ， 最 短路 径 不 是 唯一 的 ，(3,2)、(3,3)、(4,3)、(5,3)、(5,4)、(6,4)、(6,5)、 
(6,6)、(5,6)、(4,6) 是 另 一 条 最 短路 径 。 

3. C++ 实现 

现在 我 们 采取 上 述 策 略 来 设计 C++ 代码 ， 寻 找 一 个 网 格 中 的 最 短路 径 。 我 们 从 8.5.6 节 
的 迷宫 解决 方案 中 吸取 很 多 思想 。 一 个 mxm 的 网 格 被 描述 成 一 个 二 维 数组 grid， 其 中 用 0 
表示 可 到 达 的 方 格 ，1 表示 被 封锁 的 方 格 。 整 个 网 格 的 四 周 是 由 1 构成 的 一 圈 “ 障 碍 物 ”。 数 
组 offsets 帮助 我 们 从 一 个 位 置 移 动 到 相 邻 位 置 。 用 一 个 队列 来 记录 本 身 已 经 编号 而 其 相 邻 位 
置 尚未 编号 的 方 格 。 




























































































a) 7x7 的 网 格 b) a 和 b 之 间 的 布线 
图 9-12 电路 布线 示例 



























































218 锚 二 部 分 数据 绪 药 





为 了 实现 距离 标记 过 程 ， 我 们 可 以 使 用 另外 一 个 数组 存储 距离 ， 也 可 以 重用 数组 grid。 
可 实际 上 ， 电 路 布线 网 格 很 大 ， 即 使 内 存 再 大 的 计算 机 ， 存 储 这 样 的 网 格 也 是 一 个 负担 。 所 
以 我 们 不 提倡 开辟 另外 的 数组 空间 。 但 是 ， 重 用 数组 grid 存在 一 个 冲突 : 用 编号 1 表示 的 是 
具有 障碍 物 的 位 置 ， 还 是 距离 起 点 a 的 一 个 单位 的 距离 ? 为 了 解决 这 个 冲突 ， 我 们 把 所 有 距 
离 编 号 都 增加 2。 这 样 一 来 ，grid[i][j=1 表示 一 个 被 封锁 的 位 置 ; grid[i][j]>1 表示 一 个 位 置 ， 
它 距 起 始 位 置 的 距离 为 grid[i][j]-2; 对 一 个 没 封锁 且 没 有 到 达 的 位 置 grid[i]0j]=0。 

程序 9-8 是 相应 的 代码 。Grid、size、pathLengh、q、start、finish 和 path 是 全 局 变量 。 

代码 中 假设 起 始 位 置 start 和 终点 位 置 finish 都 没有 障碍 。 代 码 首 先 检查 始点 和 终点 是 否 
相同 。 如 果 相 同 ， 则 距离 等 于 0， 且 程序 终止 。 否 则 ， 在 网 格 四 周 设置 “障碍 墙 *"， 初 始 化 
offset 数组 ， 并 在 起 始 位 置 上 做 标记 2。 借助 队列 q， 并 从 位 置 start 开始 ， 首 先 移 动 距 起 始 位 
置 为 1 的 可 到 达 的 位 置 ， 然 后 移动 距 起 始 位 置 为 2 的 可 到 达 位 置 ， 这 样 不 断 进行 下 去 ， 直 至 
到 达 终 点 或 者 无 法 继续 移动 的 时 候 。 后 一 种 情况 表示 路 径 不 存在 ， 在 前 一 种 情况 下 ， 终 点 的 
标记 就 是 路 径 距 离 。 

如 果 到 达 终 点 ， 则 使 用 距离 标记 重 构 路 径 。 路 径 上 的 位 置 〈start 除外 ) 都 存储 在 数组 
path 中 。 


程序 9-8 “寻找 电路 布线 的 路 径 


bool findPath () 
{/ 寻找 从 始点 到 终点 的 最 短路 径 
1// 找 到 时 ， 返回 true， 否 则 返回 false 


if ((start.row == finish.row) && (start.col == finish.col)) 
{W 始点 == 终点 

pathLength = 0; 

return true; 
} 


1/ 初始 化 偏 移 量 
position offset[4]; 
offset[0] .row = 0; offset[0] .col = 1 // 右 
offset[1] .row = 1; offset[1].col = 0; // 下 
offset[2] .row = 0; offset{2] .col = -1; // 左 
offset[3] .row = -1; offset[3] .col = 0; NE 
1/ 初始 化 网 格 四 周 的 障碍 物 
for (int i = 0; i <= size + 1; i++) 
grid[0] [il = grid[size + 1][i] = 1; // 底部 和 顶部 
grid[i][0] = grid[ij][size + 1] = 1; // 左边 和 右边 
】 
Position here = start; 
grid[letart Eow] Latart col] = 2) // 标记 
int numOfNbrs = 4; 1/ 一 个 方 格 的 相 邻 位 置 数 


1/ 对 可 达到 的 位 置 做 标记 
arrayQueue<position> gq; 
position nbr; 

do 

{1/ 给 相 邻 位 置 做 标记 


for (int i = 0; i < numOfNbrs; i++) 
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{1/ 检查 相 邻 位 置 
nbr.row = here.row + offset[il].row; 
nbr.col = here.col + offset[i].col; 
if (grid[nbr.row] {nbr,.col] == 0) 


{1/ 对 不 可 标记 的 nbr 做 标记 
grid[lnbr.row] [nbr.col] 
= grid[here.row] [here.col] + 1; 


if ((nbr.row == finish.row) && 

(nbr.col == finish.col)) break; // 标记 完成 
1/ 把 后 者 插入 队列 
q.push (nbr); 


} 


/是 否 到 达 终 点 ? 
if ((nbr.row == finish.row) && 
(nbr.col == finish.col)) break; 1/ 到 达 


1// 终点 不 可 到 达 ， 可 以 移 到 nbr 吗 ? 
if (q.empty()) 


return false; /路 径 不 存在 
here = q.front(); /1/ 取 下 一 个 位 置 
gq.Ppop(); 


} while(true); 


1/ 构造 路 径 
pathLength = gridl[finish.row] [finish.col] - 2; 
path = new position [pathLength]; 


1/ 从 终点 回 测 
here = finish; 
for (int 1 = pathLength = 17 1 >= OF j==) 
1 
path[j] = here; 
1/ 寻找 祖先 位 置 
for (int i = 0; i < numOfNbrs; i++) 
{ 
nbr.row = here.row + offset[i] .row; 
nbr.col = here.col + offset[i].col; 
if (grid[nbr.row] [nbr.col] == j + 2) break; 
} 
here = nbr; 1/ 移 向 祖先 


return true; 


4. 复杂 度 分 析 
由 于 任意 一 个 方 格 至 多 插入 队列 1 次 ， 所 以 距离 标记 过 程 需 耗 时 O(m) (就 一 个 mxm 的 
网 格 来 说 )。 而 路 径 标 记过 程 需 耗 时 0 ( 最短 路径 长 度 )。 


9.5.3 图 元 识别 


1. 问题 描述 
数字 化 图 像 是 一 个 m x m 的 像素 矩阵 。 在 单 色 图 像 中 ， 每 一 个 像素 要 么 为 0， 要 么 为 1。 
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值 为 0 的 像素 表示 图 像 的 背景 。 值 为 1 的 像素 表示 图 元 上 的 一 个 点 ， 称 其 为 图 元 像素 。 两 个 
像素 是 相 邻 的 ， 是 指 它们 左右 相 邻 或 上 下 相 邻 。 两 个 相 邻 的 图 元 像素 是 同一 个 图 元 的 像素 。 
图 元 识别 的 目的 就 是 给 图 元 像素 做 标记 ， 使 得 两 个 像素 标记 相同 ， 当 且 仅 当 它们 是 同一 个 图 
元 的 像素 。 















考察 图 9-14a， 它 是 一 个 7x7 图 la 
像 。 空 白 方 格 表示 背景 像素 ， 标 记 为 I | 























1 的 方 格 表示 图 元 像素 。 像 素 (1,3) 和 | : 3 
(2,3) 是 同一 个 图 元 的 像素 ， 因 为 它们 由! E 
是 相 邻 的 。 像 素 (2,4) 与 (2,3) 是 相 邻 
的 ， 它 们 也 属于 同一 图 元 。 因 此 ， 三 ee 中 四 
个 像素 (1,3)、(2,3) 和 (2,4) 属于 同一 和 
个 图 元 。 由 于 没有 其 他 的 像素 与 这 三 Wn 
F 和 9-14 人 
个 像素 相 邻 ， 因 此 这 三 个 像素 定义 了 
一 个 图 元 。 图 9-14a 的 图 像 有 4 个 图 元 。 第 一 个 图 元 是 像素 集合 {(1,3)，(2,3)，(2,4)} ; 第 二 

个 是 {(3,5)，(4,4)，(4,5)，(5,5)} ; 第 三 个 是 {(5,2)，(6,1)，(6.2)，(6,3)，(7,1D)，(7,2)，(7,3)} ; 
第 四 个 是 {(5,7)，(6,7)，(7,6)，(7,7)}。 在 图 9-14b 中 ， 图 元 像素 都 做 了 标记 ， 两 个 像素 标记 
相同 ， 当 且 仅 当 它们 属于 同一 个 图 元 。 我 们 用 数字 2，3，4，… 作 为 图 元 标记 。 这 里 我 们 没 
有 用 数字 1 做 图 元 标记 ， 是 因为 我 们 用 1 表示 未 做 标记 的 图 元 像素 。 

2. 求解 策略 

ae ! 别 图 元 。 扫 描 的 方式 是 逐 行 扫描 ， 每 一 行 逐 列 扫 描 。 当 扫描 到 一 个 未 
标记 的 图 元 像素 时 ， 给 它 一 个 图 元 标记 。 然 后 把 这 个 图 元 像素 作为 一 个 新 图 元 的 种 子 ， 通 过 
识别 和 标记 ,所 有 与 该 种 子 相 邻 的 图 元 像素 ， 来 寻找 新 图 元 剩余 的 像素 。 与 种 子 相 邻 的 图 元 像 
素 称 为 1- 间距 像素 。 然 后 ， 识 别 和 标记 与 1- 间距 像素 相 邻 的 所 有 未 标记 的 图 元 像素 ， 这 些 像 
素 被 称 为 2- 间距 像素 。 接 下 来 识别 和 标记 与 2- 间距 像素 相 邻 的 未 标记 的 图 元 像素 。 这 个 过 程 
一 直 持续 到 没有 新 的 、 未 标记 的 、 相 邻 的 图 元 像素 为 止 。 

3. 用 C++ 实现 

标记 图 元 像素 的 程序 用 到 电路 布线 中 的 很 多 技术 : 用 0 值 像素 在 图 像 四 周 建 立 “ 围 墙 ”; 
用 数组 offset 来 寻找 与 给 定 像 素 相 邻 的 像素 。 

图 元 识别 问题 中 的 标记 过 程 与 电路 布线 中 用 距离 〈 与 起 始 方 格 的 距离 ) 标记 方 格 的 过 程 
因此 程序 9-9 中 的 图 元 识别 代码 与 程序 9-8 很 相似 。 

序 9-9 首先 在 图 像 周围 包 上 一 圈 背 景 像素 ( 即 0 值 像素 )， 并 对 数组 offset 初始 化 。 
人 for 循环 通过 扫描 图 像 来 寻找 下 一 个 图 元 的 种 子 。 种 子 是 一 个 未 标记 的 图 元 
像素 。 对 这 样 的 像素 ， 有 pixel[rl[clj=1。 将 pixel[r][c] 从 1 变 成 一 个 图 元 编号 (id)， 赋 给 
种 子 。 然 后 借助 一 个 队列 (也 可 借助 一 个 栈 )， 可 以 识别 出 该 图 元 中 的 其 余 像素 。 当 方法 
labelComponents 结束 时 ， 所 有 的 图 元 像素 都 已 经 获得 一 个 编号 。 


程序 9-9 ”图 元 识别 
























































void labelComponents () 
{1/ 给 图 元 编号 


// 初始 化 数组 offset 
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position offset[4]; 


offset[0] .row = 0; offset[0] .col = 1; // 右 
offset[1] .row = 1; offset[1i].col = 0:; A 下 
cffset[2].row = 0; offset[2].col = -1; // 左 
offset[3] .row = -1l; offsetl3].col = 0; WW 二 
/初始 化 0 值 像素 围墙 
for {int Vs Or iL = Size + LF di++) 
{ 
pixel[0] [i] = pixell[lsize + 1][i] = 0; /底部 和 顶部 
Pixel[il[0] = pixelfil[size + 1] = 0; // 左 和 右 
} 
int numOfNbrs = 4; // 一 个 像素 的 相 邻 位 置 数 
/ 扫描 所 有 像素 ， 标 记 图 元 
arrayQueue<position> gq; 
position here, nbr; 
int ia = 1; / 图 元 ia 
for (int r = 1; r <= size; rt++) 1/ 图 像 的 行 
for (int c = 1; c <= size; c++) // 图 像 的 列 c 
if (Pixel[z]l[cl == 1) 
{/ 新 图 元 
pixel[rl[c] = ++id; / 取 下 一 个 id 
here.row = r;} 
here.col = C7 
while (true) 
{// 寻找 其 余 的 图 元 
for (int i = 0; i < numOfNbrs; i++) 
{1/ 检查 所 有 相 令 位置 
nbr .row = here.row + offset[il].row; 
nbr.col = here.col + offset [il.col; 
it (pixel [nbr.row] [nbr.col] == 1) 
{1/ 像素 是 当前 图 元 的 一 部 分 
Pixel[nbr.row]l [nbr.col]l = id; 
q.push (nbrz) 
} 
} 
1/ 图 元 中 任意 未 考察 的 像素 
if (gq.empty()) break; 
here = q.front(); // 一 个 图 元 像素 
q-.Pop(); 
} 
} 1/ 结束 i 于 





4. 复杂 度 分 析 

初始 化 “围墙 ” 需 耗 时 B(m)， 初 始 化 offset 需 耗 时 @(1)。 尽 管 条 件 pixel[r][c]==1 检查 
了 mr 次, 但 它 为 “ 真 ”的 次 数 是 图 元 总 数 。 对 每 一 个 图 元 ， 识 别 和 标记 其 像素 ( 种 子 除外 ) 
所 需要 的 时 间 为 0 ( 图 元 中 的 像素 个 数 )。 由 于 任意 一 个 像素 都 不 会 同时 属于 两 个 或 两 个 以 
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上 的 图 元 ， 因 此 ， 识 别 并 标记 所 有 非 种 子 图 元 像素 所 需要 的 总 时 间 为 O ( 图像 中 图 元 像素 总 
数 )。 因 为 图 元 像素 总 数 等 于 输入 图 像 中 值 为 1 的 像素 个 数 ， 这 个 数 最 多 等 于 mw， 所 以 ,也 
数 labelComponents 总 的 时 间 复 杂 度 为 OU 站。 


9.5.4 .工厂 仿真 


1. 问题 描述 

一 个 工厂 有 普 台 机 器 。 工 厂 的 每 项 任务 都 需要 若干 道 工 序 才能 完成 。 每 台 机 器 都 执行 一 
道 工 序 ， 不 同 的 机 器 执行 不 同 的 工序 。 一 台 机 器 一 旦 开始 执行 一 道 工 序 就 不 会 中 断 ， 直 到 该 
工序 完成 为 止 。 

例 9-2 ”一 个 饭 金 场 可 能 对 如 下 每 道 工序 都 有 一 台 相 应 的 机 器 来 执行 : 设计 、 切 割 、 锁 
孔 、 挖 孔 、 修 边 、 造 型 和 焊接 。 每 台 机 器 每 次 执行 一 道 工序 。 

每 项 任务 都 包含 若干 道 工序 。 例 如 ， 为 一 套 新 房子 安装 暖气 管道 和 空调 管道 ， 需 要 用 一 
些 时 间 设 计 ， 然 后 用 一 些 时 间 根 据 设计 尺寸 把 金属 板 切 割 成 片 ， 在 金属 片上 钴 孔 或 挖 孔 ,把 
金属 片 塑造 成 管道 ， 烛 接管 缝 ， 打 磨 。 国 

每 道 工序 都 需要 工序 时 间 ( 即 完成 该 道 工 序 所 需要 的 时 间 ) 和 执行 该 工序 的 机 器 。 一 项 
任务 中 的 若干 道 工 序 必须 按照 一 定 顺序 来 完成 。 一 项 任务 首先 被 调度 到 执行 其 第 一 道 工 序 的 
机 器 上 ; 当 第 一 道 工 序 完成 后 ， 该 任务 被 转 到 执行 第 二 道 工 序 的 机 器 上 ; 依 此 进行 下 去 ， 直 
到 该 任务 的 最 后 一 道 工 序 完成 为 止 。 当 一 项 任务 到 达 一 台 机 器 时 ， 可 能 机 器 正 忙 ， 因 此 要 等 
待 。 事 实 上 ， 很 可 能 有 若干 项 任务 同时 在 一 台 机 器 旁 等 待 。 

每 台 机 器 都 可 以 有 如 下 三 种 状态 : 活动 状态 、 空 闲 状态 和 转换 状态 。 在 活动 状态 ， 机 器 
正在 执行 一 道 工 序 ; 在 空闲 状态 ， 机 器 无 事 可 做 ; 在 转换 状态 ， 机 器 刚刚 完成 一 道 工 序 ， 并 
准备 执行 一 道 新 工序 。 在 转换 状态 ， 机 器 操作 员 可 能 需要 清理 机 器 ， 把 刚刚 使 用 的 工具 放 好 ， 
然后 稍 作 休 息 。 每 台 机 器 在 转换 状态 所 花费 的 时 间 多 少 因 机 器 而 定 。 

当 一 台 机 器 可 以 执行 一 项 新 任务 时 ， 它 需要 从 等 待 执行 的 任务 中 选择 一 项 任务 。 我 们 假 
设 每 台 机 器 都 按照 FIFO 的 方式 来 选择 ， 因 此 在 每 台 机 器 旁 等 待 执行 的 任务 构成 一 个 队列 。 也 
可 以 假设 其 他 的 选择 方式 。 例 如 ， 根 据 任务 的 优先 级 来 选择 。 每 项 任务 都 有 一 个 优先 级 ， 当 
机 器 空闲 时 ， 等 待 执行 的 任务 中 优先 级 最 高 的 任务 被 优先 执行 。 

一 项 任务 的 最 后 一 道 工 序 的 完成 时 间 称 为 该 任务 的 完成 时 间 (finish time )。 一 项 任务 的 
长 度 等 于 其 所 有 工序 时 间 之 和 。 如 果 一 项 长 度 为 ! 的 任务 在 0 时 刻 到 达 工 厂 ， 在 /时刻 完成 ， 
那么 它 在 机 器 队列 中 的 等 待 时 间 恰 好 为 三/。 为 了 让 顾客 满意 ， 我 们 要 尽量 减少 任务 的 等 待 时 
间 。 如 果 知 道 任 务 的 等 待 时 间 是 多 少 ， 而 且 知 道 在 哪些 机 器 旁 等 待 的 时 间 最 多 ， 我 们 就 可 以 
改进 和 提高 工厂 的 效率 。 

2. 如 何 仿真 

在 对 工厂 进行 仿真 时 ， 我 们 只 是 记录 任务 在 机 器 间 的 流动 ， 并 不 实际 地 执行 任何 一 道 工 
序 。 我 们 用 一 个 模拟 时 钟 来 计时 ， 每 当 一 道 工 序 完 成 或 一 项 新 任务 到 达 工 厂 时 ， 模 拟 时 钟 就 
向 前 移动 。 机 器 上 的 工序 完成 了 ， 新 的 工序 又 产生 了 。 每 当 一 道 工 序 完 或 一 项 新 任务 到 达 工 
厂 时 ,我 们 就 称 一 个 事件 (event ) 发 生 了 。 仿真 过 程 由 一 个 启动 事件 ( start event ) 来 启动 。 
当 两 个 或 两 个 以 上 的 事件 同时 发 生 时 ， 它 们 的 顺序 任意 规定 。 图 9-15 描述 了 一 个 仿真 是 如 何 
进行 的 。 
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/初始 化 


输入 数据 
为 每 台 机 器 建立 任务 队列 
在 每 一 台 机 器 的 任务 队列 中 ， 调 度 第 一 个 任务 





// 仿真 
while( 还 有 未 完成 的 任务 ) 
{ 
确定 下 一 个 事件 
这 下 一 个 事件 是 一 台 机 咒 的 转换 工序 即 转换 状态 的 结束 ) 
从 该 机 器 的 任务 队列 中 调度 下 一 个 任务 (如果 还 有 任务 的 话 ) 





else 
// 一 道 任务 工序 完成 

将 完成 任务 工序 的 机 器 放 入 其 转换 工序 ; 

把 任务 移 到 执行 其 下 一 道 工序 的 机 器 《如 果 还 有 工序 的 话 ); 
} 











图 9-15 仿真 原理 


例 9-3 考察 一 个 工厂 ， 它 有 3 台 机 器 (m=3 )， 有 4 项 任务 (n=4 )。 假设 这 4 项 任务 都 
在 0 时 刻 出 现 ， 而且 在 仿真 期 间 不 再 有 新 的 任务 。 仿 真 过 程 一 直 持 续 到 所 有 任务 完成 为 止 。 

三 台 机 器 为 MI、M2 和 M3， 它们 的 转换 状态 所 花费 的 时 间 分 别 为 2、3 和 1。 因此， 当 
一 道 工 序 完成 时 ， 机 器 MI1 必须 等 待 2 个 时 间 单 元 才能 启动 下 一 道 工 序 ， 机 器 M2 必须 等 待 
3 个 时 间 单 元 才能 启动 下 一 道 工 序 ， 机 器 M3 必须 等 待 1 个 时 间 单 元 才能 启动 下 一 道 工序 。 
图 9-16a 分 别 列 出 了 4 项 任务 的 特征 。 例 如 ，1 号 任务 有 3 道 工 序 。 每 道 工 序 用 形 如 (机 器 ， 
时 间 ) 的 数 对 来 描述 。1 号 任务 的 第 一 道 工序 在 MI 上 完成 ， 需 要 2 个 时 间 单 元 ; 第 二 道 工序 
在 M2 上 完成 ， 需 要 4 个 时 间 单 元 ; 第 三 道 工序 在 M1 上 完成 ， 需 要 1 个 时 间 单 元 。 各 项 任务 
的 长 度 分 别 为 7、6、8 和 4。 

图 9-16b 显示 了 工厂 仿真 的 过 程 。 起 始 时 刻 ， 把 4 项 任务 插 人 其 第 一 道 工序 所 对 应 的 队 
列 中 。1 号 和 3 号 任务 的 第 一 道 工序 要 在 MI 上 执行 ， 因 此 这 两 项 任务 被 放 人 MI 的 队列 中 。 
2 号 和 4 号 任务 的 第 一 道 工 序 要 在 M3 上 执行 ， 因 此 这 两 项 任务 被 放 和 人 M3 的 队列 中 。M2 的 
队列 为 空 。 在 启动 仿真 过 程 时 ， 所 有 3 台 机 器 是 空闲 状态 。 用 符号 工 表示 空闲 状态 。 若 一 台 
机 器 处 于 空闲 状态 :， 则 该 机 器 完成 当前 工序 (实际 上 不 存在 ) 的 时 间 没有 定义 ， 我 们 用 符号 
L 来 表示 。 

仿真 从 0 时刻 开 始 。 第 一 个 事 人 即 启 动 事 件 出 现在 0 时 滥 。 此 时 ， 每 个 机 器 队列 中 的 第 
一 个 任务 被 调度 到 相应 的 机 器 上 执行 。1 号 任务 的 第 一 道 工 序 被 调度 到 M1 上 执行 ，2 号 任务 
的 第 一 道 工 序 被 调度 到 M3 上 执行 。 这 时 M1 的 队列 中 仅 剩 3 号 任务 ， 而 M3 的 队列 中 仅 剩 4 
号 任务 ，M2 的 队列 仍然 为 空 。 这 样 ，1 号 任务 成 为 M1 上 的 活动 任务 ，2 号 任务 成 为 M3 上 
的 活动 任务 ，M2 仍然 为 空闲 。MI1 的 结束 时 间 变 成 2 ( 当前 时 刻 0+ 工序 时 间 2 )，M3 的 结束 
时 间 变 成 4。 

下 一 个 事件 在 时 刻 2 出 现 ， 这 个 时 刻 是 根据 机 器 完成 时 间 的 最 小 值 来 确定 的 。 在 时 刻 2， 
M1 完成 了 它 的 当前 活动 工序 。 这 个 工序 是 1 号 任务 的 工序 。1 号 任务 被 移动 到 M2 上 以 执行 
下 一 道 工序 。 这 时 的 M2 是 空闲 的 ， 因 此 立即 执行 1 号 任务 的 第 二 道 工 序 ， 这 道 工序 将 在 第 6 
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时 刻 完成 ( 当前 时 刻 2+ 工序 时 间 4 )。M1 进入 转换 工序 ( 即 转换 状态 ) 并 持续 2 个 时 间 单 元 。 
MI1 的 活动 任务 被 设置 为 C (转换 状态 )， 其 完成 时 刻 为 4。 


工序 数目 工序 
(1,2) (2,4) (1,1) 





(3,4) (1,2) 
(1,4) (2,4) 
(3,1) (2,3) 








a ) 任务 特性 
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站 站 上 全 门 站 站 一 一 一 一 一 
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b ) 仿真 





c ) 完成 时 间 和 等 待 时 间 
图 9-16 


在 时 刻 4，AM1 和 M3 完成 了 各 自 的 当前 工序 。M1 完成 的 是 “转换 ”工序 ， 开 始 执行 新 
的 任务 ， 从 队列 中 选择 第 一 个 任务 一 一 3 号 任务 。3 号 任务 第 一 个 工序 的 长 度 为 4， 因 此 该 工 
序 的 结束 时 间 为 8，MI1 的 完成 时 间 变 为 8。2 号 任务 在 M3 上 完成 其 第 一 道 工 序 之 后 移 至 MI 
上 继续 执行 ， 由 于 MI 正 忙 ， 所 以 2 号 任务 被 放 入 MI 的 队列 。M3 进入 转换 状态 ， 转 换 状 态 
的 结束 时 刻 为 5。 以 此 类 推 , 能够 推出 剩余 的 事件 序列 。 

图 9-16c 给 出 了 任务 的 完成 时 间 和 等 待 时 间 。 因 为 2 号 任务 的 长 度 是 6， 完 成 时 间 是 12， 
所 以 它 在 机 器 队列 中 的 等 待 时 间 是 12-6=6。 类 似 的 ，4 号 任务 的 等 待 时 间 是 12-4=8。 

等 待 的 总 时 间 为 33 个 时 间 单 位 ， 可 以 确定 这 些 等 待 时 间 在 3 台 机 器 上 的 具体 分 布 。 例 
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如 ,4 号 任务 在 0 时 刻 进入 M3 的 队列 ,直到 时 刻 5 才 开始 执行 ,所 以 它 的 等 待 时 间 为 5 个 
时 间 单 元 。 其 他 的 任务 都 不 需要 在 M3 上 等 待 ， 因 此 在 M3 上 总 的 等 待 时间 为 5。 仔 细 检 查 图 
9-16b， 可 以 计算 出 在 MI 和 M2 上 的 等 待 时 间 分 别 为 18 和 10 个 时 间 单 元 。 正 如 所 料 ， 各 任 
务 的 等 待 时 间 之 和 等 于 在 各 机 器 上 的 等 待 时 间 之 和 。 加 

3. 工厂 仿真 的 好 处 

为 什么 要 进行 工厂 仿真 呢 ?” 理 由 如 下 : 

e 通过 仿真 ， 可 以 发 现 工厂 中 的 瓶颈 。 如 果 瓶 颈 是 油漆 工段 ， 就 可 以 补 强 油漆 工段 。 类 
似 的 ， 如 果 瓶 颈 是 钻 孔 等 待 时 间 过 长 ， 就 可 以 调配 更 多 的 钻 孔 操作 员 和 和 钻 孔 机 器 。 所 
以 ， 仿 真 可 以 用 于 短期 运行 调度 决策 。 

使 用 工厂 仿真 器 ， 我 们 可 以 回答 这 样 的 问题 : 如 果 用 一 台 投 资 更 多 但 效果 更 好 的 机 器 
替代 一 台 现 有 的 机 器 ， 平 均等 待 时 间 是 否 可 以 减少 ?” 因此 ， 仿 真 可 以 在 工厂 的 扩展 / 
现代 化 的 过 程 中 帮助 决策 。 

当 客 户 想 估计 任务 完成 的 准确 时 间 时 ， 可 以 通过 工厂 仿真 句 得 到 。 

4. 高 级 仿真 器 设计 

在 设计 仿真 器 时 ， 假 定 所 有 的 任务 都 在 初始 时 刻 到 达 ( 即 在 仿真 过 程 中 不 会 出 现 新 任 
务 )， 而 且 仿 真 过 程 一 直 持 续 到 所 有 任务 都 完成 时 为 止 。 

仿真 器 由 类 machineShopSimulator 来 实现 。 仿真 器 是 一 个 相当 复杂 的 程序 ， 因 此 把 它 分 
解 成 若干 个 模块 。 仿 真 器 所 执行 的 任务 是 : 输入 数据 ， 然 后 把 任务 按 其 第 一 道 工序 放 人 相应 
队列 ; 执行 启动 事件 ( 即 装 人 初始 任务 ) ; 处 理 所 有 事件 ( 即 开 始 实际 仿真 ) ; 输出 机 器 等 待 
时 间 。 一 个 任务 对 应 一 个 C++ 函数 。 程 序 9-10 是 主 函 数 。 用 全 局 变量 largeTime 表示 一 个 时 
间 ， 所 有 工序 都 必须 在 这 个 时 间 以 前 完成 。 


程序 9-10 ”工厂 仿真 的 主要 程序 


void main 1() 


{ 


inputData (); 1/ 获取 机 器 和 任务 的 数据 
startShop () ; 1// 装 入 初始 任务 
simulate{(); /执行 所 有 任务 
outputStatistics(); /输出 在 每 台 机 器 上 的 等 待 时 间 
} 
5. 结构 task 


在 设计 程序 9-10 中 所 调用 的 4 个 函数 之 前 ， 必 须 设 计数 据 对 象 的 描述 方法 ， 这 些 数 据 对 
象 包括 工序 、 任 务 、 机 器 和 事件 表 。 前 三 个 数据 对 象 用 结构 ， 第 四 个 对 象 用 类 。 

每 个 工序 都 由 两 部 分 构成 : machine ( 执行 该 工序 的 机 器 ) 和 time ( 完成 该 工序 所 需要 
的 时 间 )。 程 序 9-11 给 出 了 结构 task 的 定义 。 因 为 机 器 的 编号 是 整 型 ， 所 以 machine 是 int 类 
型 。 假 设 所 有 的 时 间 都 是 整数 。 


程序 9-11 结构 task 
struct task 
{ 
int machine,; 
int time; 


task(lint theMachine = 0, int theTime = 0) 
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machine = theMachine; 
time = theTime; 


结构 job 
每 项 任务 都 有 一 个 工序 表 ， 每 道 工 序 按 表 中 的 顺序 执行 。 可 以 把 工序 表 描 述 成 一 个 队列 
taskQ。 为 了 计算 一 项 任务 的 总 等 待 时 间 ， 需 要 知道 该 任务 的 长 度 和 完成 时 间 。 完 成 时 间 通 过 
计时 确定 ， 任 务 长 度 为 各 工序 时 间 之 和 。 为 了 计算 任务 长 度 ， 我 们 定义 一 个 数据 成 员 length。 
程序 9-12 给 出 了 结构 job 的 定义 。 


程序 9-12 ”结构 job 
struct job 
{ 


arrayQueue<task> taskQ; /任务 的 工序 

int length; 1/ 被 调度 的 工序 时 间 之 和 
int arrivalTime; /到 达 当 前 队列 的 时 间 
int id; /任务 标志 符 


Job (int theId = 0) 
{ 
id = thelId; 
length = 0» 
arrivalTime = 0; 
} 


void addTask (int theMachine, int theTime) 
{ 
task theTask (theMachine, theTime); 
taskQ .push (theTask); 
} 


int removeNextTask () 
{/ 删除 任务 的 下 一 道 工序 ， 返 回 它 的 时 间 
1/ 更 新 长 度 


int theTime = taskQ.front() .time; 
taskQ.pop(); 

length += theTime; 

return theTime; 


}; 


数据 成 员 arrivalTime 用 于 记录 一 项 任务 进入 当前 机 器 队列 的 时 间 ， 然 后 确定 该 任务 在 这 
个 队列 中 的 等 待 时 间 。 任 务 标志 符 存储 在 id 中 ， 仅 在 输出 该 任务 的 总 的 等 待 时 间 时 才 会 使 用 
这 个 标志 符 。 

方法 addTask 把 一 道 工 序 加 入 任务 的 工序 队列 中 。 该 工序 在 机 器 theMachine 上 执行 ， 需 
要 时 间 为 theTime。 全 区 EGR ee 
活动 状态 时 ， 使 用 方法 removeNextTask。 这 时 ， 该 任务 的 第 一 道 工 序 从 工序 队列 (工序 队列 
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用 于 保存 尚未 被 执行 的 工序 ) 中 删除 ， 并 把 该 工序 时 间 加 到 任务 长 度 中 ， 然 后 返回 该 工序 时 
间 。 当 调度 任务 的 最 后 一 道 工序 时 ， 数 据 成 员 length 的 值 等 于 该 任务 的 长 度 。 

7. 结构 machine 

每 台 机 器 都 有 转换 时 间 、 当 前 任务 和 等 竺 任务 的 队列 。 由 于 每 项 任务 在 任何 时 刻 只 会 在 
一 台 机 咒 队 列 中 ， 因 此 所 有 队列 的 空间 总 量 以 任务 的 数目 为 限 。 不 过 ， 任 务 在 各 个 机 器 队列 
中 的 分 布 随 着 仿真 过 程 的 进展 会 不 断 变 化 。 有 的 队列 在 某 一 时 刻 可 能 很 长 。 如 果 使 用 链 队 列 ， 
就 可 以 把 机 器 队 列 所 需要 的 空间 限制 为 n 个 节点 的 空间 ， 其 中 是 任务 个 数 。 

程序 9-13 是 结构 machine 的 定义 。 数 据 成 员 jobQ 、changeTime 、totalWait、numTasks 和 
activeJob 分 别 表示 等 待 任务 的 队列 、 机 器 的 转换 时 间 、 任 务 在 机 器 上 总 的 等 待 时 间 、 机 器 所 
执行 的 工序 数目 和 当前 任务 。 当 机 需 空 闲 或 处 于 转换 状态 时 ， 当 前 处 理 的 任务 为 NULL。 


程序 9-13 ”结构 machine 





struct machine 
{ 


arrayQueue<ijob*> jobo' 


/本 机 器 的 等 待 处 理 的 任务 队列 


int changeTime; 1/ 本 机 器 转换 时 间 

int totalWait; 1/ 本 机 器 的 总 体 延 时 
int numTasks; 1/ 本 机 器 处 理 的 工序 数量 
job* activeJob; 1/ 本 机 器 当前 处 理 的 任务 


machine() 

{ 
totalWait = 0; 
numTasks = 07 
activeJob = NULL; 


}; 


8. 类 EventList 

所 有 机 顺 的 完成 时 间 都 存储 在 一 个 事件 表 中 。 为 了 从 一 个 事件 转向 下 一 个 事件 ， 我 们 
需要 在 机 器 的 完成 时 间 中 确定 最 小 者 。 仿 真 器 还 需要 一 个 操作 ,来 设置 一 台 特 定 机 器 的 完成 
时 间 。 每 当 一 个 新 任务 被 调度 到 一 台 机 器 上 运行 时 就 要 执行 该 操作 。 当 一 台 机 器 空闲 时 ， 其 
完成 时 间 被 设置 成 一 个 很 大 的 数 largeTime。 程 序 9-14 是 类 eventList 的 定义 ， 它 用 一 维 数组 
finishTime 实现 事件 表 ，finishTime[p] 表示 机 器 p 的 完成 时 间 。 


程序 9-14 类 eventList 


Class eventList 
{ 
public: 
eventList (int theNumMachines, int theLargeTime) 
{1/ 为 m 台 机 器 ,初始 化 其 完成 时 间 
if (theNumMachines < 1) 
throw illegalParameterValue 
("number of machines must be >= 1"); 
numMachines = theNumMachines; 
finishTime = new int [numMachines + 1]; 


1/ 所 有 机 器 都 空 闪 ， 用 大 的 完成 时 间 初 始 化 
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for (int i = 1; i <= numMachines; i++) 
finishTime[i] = theLargeTime; 
} 


int nextEventMachine() 


{// 返回 值 是 处 理 下 一 项 工序 的 机 器 


1/ 寻找 完 成 时 间 最 早 的 机 器 
int p= 1; 
int t = finishTime[1]; 
for (int i = 2; i <= numMachines; i++) 
if (finishTime[i] < t) 
{1/ 机 器 并 完成 时 间 更 早 
和 
臣 


’ 


水 

finishTime[i]; 
} 

return: B> 


) 


int nextEventTime (int theMachine) 
{return finishTime [theMachine];} 


void setFinishnTime (int theMachine, int theTime) 


{finishTime [theMachine] = theTime,;} 

private: 
int* finishTime; 1/ 完成 时 间 数 组 
int numMachines; /机 器 数量 


} ; 


方法 nextEventMachine 的 返回 值 是 第 一 个 完成 其 活动 工序 的 机 器 。 机 器 p 完 成 其 活动 
工序 的 时 间 通 过 调用 方法 nextEventTime(p) 来 确定 。 对 于 一 个 有 m 台 机 器 的 工厂 ， 寻 找 其 最 
小 的 完成 时 间 需 要 耗 时 @(m)， 因 此 nextEventMachine 的 复杂 度 为 9(m)。 方 法 setFinishTime 
用 来 设置 一 台 机 器 的 完成 时 间 ， 其 复杂 度 为 6(1)。 在 第 13 章 ， 将 引入 两 个 数据 结构 一 一 
堆 和 最 左 树 ， 每 一 个 都 可 以 描述 事件 表 。 这 时 ，nextEventMachine 和 setFinishTime 的 复 
杂 度 均 变 成 O(logm)。 如 果 所 有 任务 的 工序 总 数 为 numTasks， 那么 ,一 次 仿真 运行 ,方法 
nextEventMachine 和 setFinishTime 各 自 调用 次 数 为 9(numTasks)。 使 用 程序 9-14 的 事件 表 ， 
调用 nextEventMachine 和 setFinishTime 需要 总 耗 时 为 G9(numTasks*m) ; 而 使 用 堆 或 最 左 树 ， 
总 耗 时 为 9(numTasks*logm)。 虽 然 堆 或 最 左 树 的 结构 有 些 复 杂 ， 但 是 当 m 比较 大 时 ， 它 们 可 
以 加 快 仿真 过 程 。 

9. 全 局 变量 

程序 9-15 是 全 局 变量 。 多 数 全 局 变量 的 含义 从 变量 名 中 就 可 以 看 出 来 。timeNow 是 模拟 
的 时 钟 ， 记 录 当 前 时 间 。 每 次 发 生 一 个 事件 ， 就 会 修改 timeNow 的 值 。largeTime 表示 的 时 间 
大 于 最 后 一 个 任务 的 完成 时 间 。 


程序 9-15 仿真 器 中 所 使 用 的 全 局 变量 


/全 局 变量 
int timeNow; 1/ 当前 时 间 
int numMachines; /机 器 数量 


int numJobs; // 任务 数量 
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eventList* eList; 1/ 事件 表 的 指针 
machine* mArray; /机 器 数组 
int largeTime = 10000; /在 这 个 时 间 之 前 所 有 机 器 都 已 完成 工序 


10. 函数 inputData 

在 郴 数 inputData 的 代码 ( 见 程序 9-16 ) 中 ， 首 先 输入 机 器 数 和 任务 数 ， 然 后 创建 初始 
事件 表 eList ( 其 中 每 台 机 器 的 完成 时 间 均 为 largeTime ) 和 机 器 数组 mArray。 接 下 来 输入 每 
台 机 器 的 转换 时 间 。 然后 依次 输入 每 项 任务 。 对 于 每 项 任务 ， 首 先 输 入 该 任务 的 工序 数目 ， 
然后 按 (machine，time ) 的 形式 输入 每 个 工序 。 执 行 任务 的 第 一 道 工 序 的 机 器 被 记录 在 变量 
firstMachine 中 。 当 一 个 任务 的 所 有 工序 都 已 输入 完毕 时 ， 该 任务 被 插入 执行 第 一 道 工 序 的 机 
促 队 列 中 。 


程序 9-16 输入 工厂 数据 


void inputData() 


{W/ 输入 工厂 数据 


cout << "Enter number of machines and jobs" << endl; 
cin >> numMachines >> numJobs; 
if (numMachines < 1 || numJobs < 1) 
throw illegalIinputData 
("number of machines and jobs must be >= 1"); 


1/ 生成 事件 和 机 器 队列 
eList = new eventList (numMachines, largeTime); 
mArray = new machine [numMachines + 1]; 


1/ 输入 机 器 的 转换 时 间 

cout << "Enter change-over times for machines" << endl; 
4 到 已 

for (int ] = 1; jj <= numMachines; j++) 


{ 
Cin SS Gtk 
主 和 (et < D0) 
throw illegalIinputData("change-over time must be >= 0")， 
maArray[j] .changeTime = ct; 


} 


1/ 输入 任务 
job* theJob; 
int numTasks, firstMachine, theMachine, theTaskTime; 
for (int i = 1; i <= numJobs; i++) 
{ 
Cout << "Enter number of tasks for job " << i << endil,; 
cin >> numTasks,; 
firstMachine = 0; /第 一 道 工 序 的 机 器 
if (numTasks < 1) 
throw illegalinputData("each job must have > 1 task"); 


/生成 任务 

theJob = new job(i) 

cout << "Enter the tasks (machine, time)™" 
<< " in process order" << endl; 
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for (int Jj = 1 Jj <= numTasks; j++) 
{1/ 读 取 任务 i 的 工序 
cin >> theMachine >> theTaskTime; 
if (theMachine < 1 || theMachine > numMachines 
| 1 theTaskTime < 1) 
throw illegalIinputData("bad machine number or task 七 ime") 


jf 二 
firstMachine = theMachine; 1/ 处 理 任务 的 第 一 台 机 器 
theJob->addTask (theMachine, theTaskTime); 1// 加 到 工序 队列 


} 
mArray[firstMachinel] .jobQ.push (theJob); 


} 


11. 函数 startShop 和 changeState 

为 了 启动 仿真 过 程 ， 需 要 从 每 台 机 器 的 任务 队列 中 取出 第 一 个 任务 并 放 到 该 机 器 上 执行 。 
由 于 每 台 机 器 的 初始 状态 为 空闲 状态 ， 所 以 加 载 初始 任务 都 是 把 机 器 从 空闲 状态 变 成 活动 状 
态 。 方 法 changeState(i) 便 用 于 机 器 i 的 这 种 转换 。 程 序 9-17 是 启动 工厂 仿真 的 方法 ， 它 只 需 
对 每 台 机 器 调用 changeState 即 可 。 


程序 9-17 ”启动 仿真 





void StattShop () 
{// 在 每 台 机 器 上 装载 其 第 一 个 任务 
for (int p= 1; p <= numMachines; p++) 
changeState (p); 
} 


程序 9-18 是 函数 changeState 的 代码 。 如 果 机 还 theMachine 空闲 或 处 于 转换 状态 ， 则 
changeState 返回 NULL， 否 则 返回 机 旭 theMachine 当前 正在 执行 的 任务 。 此 外 ，changeState 
( theMachine ) 改变 机 需 theMachine 的 状态 。 如 果 机 器 theMachine 先前 为 空闲 或 处 于 转换 状 
态 ， 则 开始 执行 队列 中 的 下 一 项 任务 。 如 果 队 列 为 空 ， 则 将 机 器 的 状态 设置 为 空间 。 如 果 机 
器 theMachine 先前 正在 执行 一 项 任务 ， 则 进入 转换 状态 。 

如 果 mArray[theMachine].activeJob 为 NULL， 则 机 器 theMachine 要 人 么 空闲 ， 要 么 处 于 转 
换 状 态 ; 任务 lastJob 的 返回 值 是 NULL。 如 果 机 器 的 任务 队列 为 空 ， 则 将 该 机 器 转 人 空闲 状 
态 ， 并 将 其 完成 时 间 设 置 为 largeTime。 如 果 任 务 队列 不 为 空 ， 则 删除 队列 中 的 第 一 个 任务 ， 
并 使 其 成 为 机 器 theMachine 的 活动 任务 。 该 任务 在 队列 中 的 等 待 时 间 被 累加 到 该 机 器 的 总 的 
等 待 时 间 中 ， 同 时 将 该 机 器 所 处 理 的 工序 数目 增加 1。 接 下 来 把 将 要 处 理 的 工序 从 任务 的 工 
序 表 中 删除 ， 并 将 机 器 的 完成 时 间 设 置 为 新 工序 的 完成 时 间 。 

如 果 mArray[theMachine].activeJob 不 为 NULL， 则 表明 机 器 theMachine 一 直 在 处 理 一 项 
任务 ， 这 项 任务 刚刚 完成 。 因 为 这 项 任务 将 作为 返回 值 ， 所 以 它 被 存储 在 变量 lastJob 中 。 现 
在 机 器 应 该 进入 转换 状态 ， 持 续 时 间 为 changeTime。 


程序 9-18 ”修改 机 器 状态 
job* changestate(int theMachine) 
{// 机 器 theMachine 上 的 工序 完成 了 ,调度 下 一 道 工序 
/1/ 返回 值 是 在 机 器 theMachine 上 刚刚 完成 的 任务 
job* lastJob; 
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if (mArray[theMachine] .activeJob == NULL) 
{1/ 处 于 空闲 或 转换 状态 
lastJob = NULL; 
1/ 等待， 准备 处 理 新 的 任务 
if (mArray[theMachine] .jobQ.empty()) 1/ 没有 等 待 执行 的 任务 
eList->setFinishTime (theMachine, largeTime); 
else 
{1/ 从 队列 中 提取 任务 ,在 机 器 上 执行 
mArray[theMachine] .activeJob = 
mArray[theMachine] .jobQ.front (); 
mArray[theMachine] .jobQ.pop(); 
mArray[theMachine] .totalWait += 
timeNow - marray[theMachine] .activeJob->arrivalTime; 
maArray[theMachine] .numTasks++; 
int t = mArray[ltheMachine] .activeJob->removeNextTask!(); 
eList->setrFinishTime (theMachine, timeNow + t); 
} 
} 
else 
{/ 在 机 器 theMachine 上 刚刚 完成 一 道 工序 
/设置 转换 时 间 
lastJob = mArtay [theMachine] .activeJob; 
mArray[theMachine] .activeJob = NULL; 
eList->setFinishTime (theMachine, timeNow + mArray{[theMachine] .changeTime); 


} 


return lastJob; 


12. 函数 simulate 和 moveToNextMachine 

在 程序 9-19 中 ， 消 数 simulate 对 所 有 事件 循环 调度 ， 直 到 最 后 一 项 任务 完成 。numJobs 是 
尚未 完成 的 任务 数目 ，while 循环 在 numJobs 等 于 0 时 结束 。 在 while 循环 的 每 一 次 迭代 中 ， 要 
确定 下 一 个 事件 的 时 间 并 将 该 时 间 存 人 变量 timeNow。 对 于 产生 事件 的 机 器 nextToFinish， 我 们 
要 改变 它 的 状态 。 如 果 该 机 器 刚刚 处 理 完 一 道 工 序 (theJob 不 为 NULL )， 则 调度 任务 theJob 进 
和 人 该 机 器 ， 执 行 该 任务 的 下 一 道 工 序 。 函 数 moveToNextMachine 执行 这 个 调度 。 如 果 任 务 theJob 
没有 下 一 道 工序 ， 则 该 任务 完成 ， 函 数 moveToNextMachine 将 返回 false， 而 且 将 numJobs 减 1。 


程序 9-19 ”处 理 所 有 任务 


void simulate() 
{/ 处 理 所 有 未 处 理 的 任务 
while (numJops > 0) 
{// 至 少 有 一 个 任务 未 处 理 
int nextToFinish = eList->nextEventMachine ()， 
timeNow = eList->nextEventTime (nextToFinish); 
// 改变 机 器 nextToFinish 上 的 任务 
job* theJob = changeState (nextToFinish); 
1/ 把 任务 theJob 调度 到 下 一 台 机 器 
1/ 如 果 任 务 theJob 完成 ， 则 减少 任务 数 
if (theJob != NULL && !moveToNextMachine (theJob)) 
numJobs——;} 
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函数 moveToNextMachine ( 见 程序 9-20 ) 首先 查看 任务 theJob 中 是 否 有 尚未 被 处 理 的 工 
序 。 如 果 没 有 ， 则 该 任务 已 完成 ， 应 该 输出 该 任务 的 完成 时 间 和 等 待 时 间 。 函 数 返 回 false 以 


表明 任务 theJob 不 再 需要 机 器 来 处 理 。 
如 果 任 务 theJob 还 有 下 一 道 工序 ， 则 要 确定 执行 这 道 工 序 的 机 器 p， 然 后 把 任务 theJob 


加 入 该 机 器 的 等 待 处 理 的 任务 队列 中 。 如 果 机 器 p 为 空 闪 ， 则 调用 函数 changeState 来 改变 它 
的 状态 ， 使 它 立 即 处 理 任务 theJob 的 下 一 道 工序 。 


程序 9-20 ”把 一 项 任务 移 至 下 一 道 工序 对 应 的 机 器 


bool moveToNextMachine (job* theJob) 
{VW 调度 任务 theJob 到 执行 其 下 一 道 工序 的 机 器 
1/ 如 果 任 务 已 经 完成 ， 则 返回 false 


if (theJob->taskQ.empty()) 
{1/ 没有 下 一 道 工序 
cout << "Job ™" << theJob->id << ”has completed at " 
<< timeNow << " Total wait was " 
<< (timeNow - theJob->length) << endl; 
return false; 
} 
else 
{1/ 任务 theJob 有 下 一 道 工序 
/ 确定 执行 下 一 道 工序 的 机 器 
int p = theJob->taskQ.front() .machine; 
/把 任务 插入 机 器 的 等 待 任务 队列 
mArzay[P] .jobQ.push (theJob); 
theJob->arrivalTime = timeNow; 
1/ 如 果 机 器 P 空闲 ， 则 改变 它 的 状态 
if (eList->nextEventTime (P) == largeTime) 
// 机 器 空闲 
changeState(P) 


return 七 YUe7 
} 


13. 函数 outputStatistics 
由 于 一 个 任务 的 完成 时 间 和 等 待 时 间 已 由 函数 moveToNextMachine 输出 ， 因 此 函数 


outputStatistics 只 需 输出 完成 所 有 任务 所 需要 的 时 间 ( 它 也 是 最 后 一 个 任务 的 完成 时 间 ， 而 且 
在 moveToNextMachine 中 已 经 输出 ) 和 每 台 机 器 的 统计 信息 (总 的 等 待 时 间 和 处 理 的 工序 数 


目 )。 程 序 9-21 是 相应 的 代码 。 
程序 9-21 输出 每 台 机 器 的 等 待 时 间 


void outputStatistics() 
{// 输出 在 每 台 机 器 上 的 等 待 时 间 
cout << "Finish time = " << timeNow << endl; 
for (int p = 1 p <= numMachines; p++) 
{ 
cout << "Machine " << p << "“ completed " 
mArray [P] .numTasks << " tasks" << endl; 


< 
cout << "The total wait time was 


人 
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<< mArray[p] .totalWait << endl; 
cout << endl; 
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本 节 中 的 哪 一 个 应 用 可 以 用 栈 代替 队列 且 不 影响 程序 的 正确 性 ? 

1 ) 一 个 转轨 站 有 三 条 按 队列 模式 运行 的 缓冲 轨道 。 车 厢 的 初始 顺序 为 3,1,7,6,2,8,5,4。 
在 9.5.1 节 的 求解 策略 下 ， 每 一 节 车 而 移动 之 后 ， 按 照 图 9-11 ， 夯 出 缓冲 轨道 、 入 轨道 
和 出 轨道 的 布局 。 

2 ) 当 缓冲 轨道 为 两 条 时 ， 完 成 1 )。 


.采用 个 队列 模式 的 缓冲 轨道 ， 对 于 所 有 可 能 的 车 厢 排 列 ， 程序 9-6 能 否 成 功 地 进行 车 而 


重 排 ? 试 证 明 你 的 结论 。 


. 重 写 程序 9-6,， 假定 任意 时 刻 在 缓冲 轨道 上 中 最 多 只 能 有 8， 节 车 厢 。 将 s; 值 最 小 的 铁轨 作 


为 直接 通道 。 


. 当 每 一 次 移动 一 节 和 车厢 之 后 ， 你 都 必须 显示 缓冲 轨道 的 状态 时 ， 你 可 以 不 用 队列 ， 而 用 车 


厢 重 排 问 题 求解 的 第 二 个 实现 方法 吗 ? 证 明 你 的 答案 。 
不 使 用 栈 ， 可 以 解决 8.5.3 节 的 问题 吗 ( 参看 9.5.1 节 的 第 二 个 实现 方法 ) ? 如 果 可 以 ， 设 
计 和 测试 你 的 程序 。 


. 考虑 图 9-13a 的 电路 布线 网 格 。 要 求 在 (1,4) 和 (2,2) 之 间 布 一 条 线路 。 在 距离 标记 过 程 中 ， 


用 距离 给 所 达到 的 方 格 做 标记 。 然 后 用 路 径 标记 过 程 的 方法 标记 最 短线 路 路 径 。 

设计 一 个 完整 的 用 于 电路 布线 的 C++ 程序 。 程 序 应 包含 如 下 函数 : welcome 函数 ( 用 于 显 
示 程 序 名 称 和 功能 ) ; 输入 函数 ( 用 于 输入 网 格 的 数量 、 封 锁 的 和 未 封锁 的 网 格 位置 、 电 
路 的 端点 ); findPath 函数 〈( 见 程序 9-8 ); 输出 函数 ( 用 于 输出 带 有 电路 路 径 的 网 格 )。 测 
试 程序 的 正确 性 。 


.在 电路 布线 的 一 个 典型 应 用 中 ， 若 干 个 线路 顺序 布线 。 一 条 电路 布线 完毕 ， 它 所 占用 的 网 


格 被 封锁 ， 然 后 下 一 条 电路 继续 布线 。 当 数组 grid 重复 使 用 ， 表 示 封 锁 和 未 封锁 的 位 置 
以 及 距离 时 ， 在 记录 新 的 线路 之 前 ， 要 清除 数组 grid (将 路 径 上 的 方 格 都 设置 为 1， 将 其 
余 标 记 大 于 1 的 方 格 设置 为 0)。 编写 一 个 函数 来 实现 清除 数组 grid 的 操作 。 首 先 利 用 类 
似 于 距离 标记 过 程 的 方法 恢复 方 格 的 初始 值 。 然 后 封锁 刚刚 找到 的 路 径 上 的 位 置 。 这 样 一 
来 ， 清 除数 组 的 复杂 度 和 距离 标记 的 复杂 度 一 样 。 


.设计 一 个 完整 的 图 元 识别 的 C++ 程序 。 程 序 应 包含 welcome 也 数 ( 用 于 显示 程序 名 称 和 


功能 ); 输入 函数 (用 于 输入 图 像 的 大 小 及 单 色 图 像 ) ; 函数 labelComponents ( 见 程序 
9-9 ) ; 输出 函数 ( 用 于 输出 识别 后 的 图 像 ， 不 同 图 元 中 的 像素 用 不 同 的 颜色 )。 测 试 程序 
的 正确 性 。 

采用 栈 来 重 写 函数 labelComponents。 使 用 栈 来 代替 队列 ， 有 哪些 优点 和 缺点 ? 

能 否 把 程序 8-6 中 的 栈 换 成 队列 ? 为 什么 ? 

能 否 把 程序 8-13 中 的 栈 换 成 队列 ? 为 什么 ? 

能 和 否 把 程序 8-14 中 的 栈 换 成 队列 ? 为 什么 ? 

能 否 把 程序 8-15 中 的 栈 换 成 队列 ? 为 什么 ? 
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34. 设计 一 个 改进 的 工厂 仿真 器 ， 人 允许 指定 同一 个 任务 中 各 个 相 邻 的 工序 之 间 最 少 的 等 待 时 
间 。 在 完成 一 项 任务 的 每 一 道 工 序 ( 包括 最 后 一 道 工 序 ) 时 ， 仿 真 器 必须 使 该 任务 进入 等 
待 状态 。 因 此 ， 一 项 任务 的 一 道 工 序 一 完成 ， 该 任务 就 被 立即 插入 下 一 个 队列 。 该 任务 一 
进入 队列 ， 就 进 人 等 待 状态 。 当 一 台 机 器 准备 启动 一 道 新 工序 时 ， 它 必须 跳 过 在 队 头 仍 处 
于 等 待 状态 的 任务 。 可 以 把 被 跳 过 的 任务 移 到 队 尾 。 

35. 设计 一 个 改进 的 工厂 仿真 器 ， 允 许 新 任务 在 仿真 期 间 到 达 。 仿 真 过 程 在 预定 的 时 刻 结束 ， 
尚未 完成 的 任务 保持 未 完成 状态 。 


9.6 参考 及 推荐 读物 


9.5.2 节 中 的 电路 布线 算法 是 著名 的 李 氏 路 由 算法 。 选 自 N. Sherwani. Algorithms for VLSI 
Physical Design Automation. 2nd ed. Kluwer Academic Publishers, Boston, 1995. 书 中 详细 讨论 了 
该 算法 ， 并 给 出 了 其 他 算法 。 
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跳 表 和 散 列 





虽然 在 个 元 素 的 有 序数 组 上 折 半 查找 所 需要 的 时 间 为 O(logn)， 但 是 在 有 序 链表 上 查找 
所 需要 的 时 间 为 O(n)。 为 了 提高 有 序 链表 的 查找 性 能 ， 可 以 在 全 部 或 部 分 节点 上 增加 额外 的 指 
针 。 在 查找 时 ， 通 过 这 些 指针 ， 可 以 跳 过 链表 的 若干 个 节点 ,不必 从 左 到 右 连 续 查 看 所 有 节点 。 

增加 了 额外 的 向 前 指针 的 链表 叫做 跳 表 (skip list )。 它 采用 随机 技术 来 决定 链表 的 哪些 
节点 应 增加 向 前 指针 ， 以 及 增加 多 少 个 指针 。 基 于 这 种 随机 技术 ， 跳 表 的 查找 、 插 入 、 删 除 
的 平均 时 间 复 杂 度 为 O(logn)。 然 而 ， 最 坏 情况 下 的 时 间 复 杂 度 却 变 成 @(m)。 

散 列 是 用 来 查找 、 搬 和 人 入、 删除 的 另 一 种 随机 方法 。 与 跳 表 相 比 ， 它 把 所作 时 间 提 高 到 
@(1)， 但 最 坏 情 况 下 的 时 间 仍 为 9(n)。 尽 管 如 此 ， 如 果 经 常 需要 按 序 输出 所 有 元 素 或 按 序 查 
找 元 素 ( 如 查找 第 10 个 最 小 元 素 )， 那 么 跳 表 的 执行 效率 将 优 于 散 列 。 

有 序数 组 、 有 序 链 表 、 跳 表 和 哈 希 表 的 渐 近 性 能 汇总 在 下 面 的 表 中 。 











有 序数 组 O(n) O(n) 
有 序 链 表 O(n) O(n) 
跳 表 O(logn) O(logn) 





哈 希 表 9(1) @(1) 





C++ 的 STL 中 使 用 了 散 列 的 容器 类 有 : hash map、hash_multimap、hash_multiset、hash _ set。 
本 章 有 一 个 散 列 的 应 用 : 文本 压缩 和 解压 缩 。 程 序 是 基于 当前 流行 的 Lempel-Ziv-Welch 
算法 来 编写 的 。 


10.1 字典 


字典 ( dictionary ) 是 由 一 些 形 如 (k,v) 的 数 对 所 组 成 的 集合 ， 其 中 上 是 关键 字 ，Y 是 与 关 
键 字 上 对 应 的 值 (也 可 以 说 ，y 是 值 ， 它 的 关键 字 是 上 )。 任 意 两 个 数 对 ， 其 关键 字 都 不 等 。 

有 关 字 典 的 操作 有 : 

e 确定 字典 是 否 为 空 。 

e 确定 字典 有 多 少数 对 。 

e@ 寻找 一 个 指定 了 关键 字 的 数 对 。 

e 插入 一 个 数 对 。 

e 删除 一 个 指定 了 关键 字 的 数 对 。 

例 10-1 一 个 班级 选修 数据 结构 课程 的 清单 是 一 个 字典 。 当 一 个 新 学 生 要 选修 数据 结构 
时 ， 与 该 学 生 有 关 的 数 对 /记录 被 搬入 字典 。 当 一 个 学 生 放弃 这 门 课程 时 ， 他 的 记录 从 字典 





中 删除 。 在 课程 进行 中 ， 老 师 可 以 通过 字典 查看 某 个 学 生 的 记录 或 修改 相关 的 记录 ( 例如 ， 
加 入 或 修改 考试 成 绩 )。 学 生 姓 名 可 以 作为 关键 字 ， 其 他 信息 是 与 关键 字 相 关 的 值 。 图 

一 个 多 重 字 典 ( dictionary with duplicate ) 与 上 述 字 典 类 似 ， 只 是 两 个 或 更 多 的 数 对 可 以 
具有 相同 的 关键 字 。 

例 10-2 ”一 个 字典 是 数 对 的 集合 ， 每 个 数 对 都 由 一 个 词 和 它 的 值 组 成 。 一 个 词 的 值 包括 
词 的 意思 、 发 音 、 词 源 等 等 。 在 韦 氏 字典 中 ， 包 含 与 词 date 对 应 的 是 一 个 数 对 ( 词 条 )。 这 个 
数 对 的 一 部 分 是 “date，the point of time at which a transaction or event takes place”， 其 中 date 
是 关键 字 。 实 际 上 ， 韦 氏 字 典 有 若干 个 带 有 关键 字 date 的 数 对 。 它 们 的 简化 形式 是 “date， 
the oblong fruit of a palm” 和 “date，to assign a chronology record”。 随 着 新 词 的 出 现 和 新 词 意 
的 出 现 ， 字 上 典 出 版 商 把 新 的 数 对 插入 字典 。 当 一 个 词 不 再 用 了 ， 出 版 商 就 把 相应 的 数 对 从 字 
典 中 删除 。 在 使 用 字典 时 ， 通常 都 是 按照 一 个 给 定 的 关键 字 查 找 数 对 。 偶 尔 也 会 插入 一 个 新 
的 数 对 。 数 据 结构 专业 字典 是 多 重 字 典 ， 不 同 的 数 对 可 以 有 相同 的 关键 字 ， 相 关 的 操作 有 查 
找 、 插 入 和 删除 。 虽 然 在 正式 印刷 的 字典 中 数 对 是 按照 关键 字 的 字典 顺序 排列 的 ， 但 是 在 一 
个 电子 字典 中 不 必 这 样 组 织 。 计 算 机 可 以 按照 任何 你 喜欢 的 方式 组 织 字 典 。 国 

一 个 电话 秒 也 是 一 个 多 重 字典 。 

在 一 个 多 重 字典 中 进行 查找 和 删除 操作 时 ， 需 要 消除 歧义 。 就 查找 而 言 ， 有 两 种 可 能 : 
1 ) 查找 任何 一 个 具备 给 定 关键 字 的 数 对 ; 2 ) 查找 所 有 具备 给 定 关键 字 的 数 对 。 就 删除 操作 
而 言 ， 我 们 要 求 给 用 户 提 供与 给 定 关 键 字 对 应 的 所 有 数 对 ， 由 用 户 选 择 删除 哪些 数 对 。 此 外 ， 
可 以 任意 删除 与 给 定 关键 字 对 应 的 一 个 数 对 或 所 有 数 对 。 

无 论 是 字典 还 是 多 重 字 典 ， 有 时 还 需要 另 一 种 形式 的 删除 操作 ， 即 删除 在 某 一 时 间 之 后 
插 人 的 所 有 数 对 。 

例 10-3 编译 器 使 用 的 符号 表 ( symbol table ) 是 一 个 用 户 定义 的 多 重 字 典 。 当 一 个 描述 
符 被 定义 了 ， 与 之 对 应 的 一 个 数 对 ( 关键 字 ， 值 ) 就 产生 了 ， 并 插入 符号 表 中 。 描 述 符 是 关 
键 字 ， 描 述 符 的 类 型 ( 整 型 、 浮 点 型 等 )、 描 述 符 的 值 所 需要 的 相对 存储 空间 地 址 就 构成 了 相 
应 的 值 。 因 为 在 不 同 的 程序 块 中 ， 可 以 定义 同样 的 描述 符 ， 所 以 符号 表 很 可 能 有 多 个 关键 字 
相同 的 记录 。 搜 索 结 果 应 是 最 新 插入 的 数 对 。 只 有 在 一 个 程序 模块 结束 时 才能 执行 删除 操作 ， 
所 有 在 该 模块 开始 以 后 插入 的 数 对 都 要 删除 。 国 

查找 操作 可 以 按照 你 给 定 的 关键 字 ， 随 机 地 存 取 字 典 中 的 数 对 。 有 些 字 典 的 应 用 还 有 另 
一 种 存 取 模式 一 一 顺序 存 取 ( sequential access )。 在 这 种 存 取 模 式 中 ， 利 用 和 迭代 器 ， 按 关键 字 
的 升值 顺序 逐个 查找 字典 数 对 。 本 章 设计 的 所 有 字典 实现 代码 ( 哈 希 表 除 外 ) 既 可 以 随机 存 
取 ， 也 可 以 顺序 存 取 。 


练习 


1. 在 一 本 字典 中 查找 有 多 个 词 条 的 词 ( 不 是 date )。 试 着 查找 多 于 三 个 词 条 的 词 。 

2. 给 出 字典 和 多 重 字典 的 三 个 实际 应 用 。 不 能 与 本 节 的 应 用 相同 。 解 释 一 下 ， 哪 一 种 字典 操 
作 在 每 一 个 应 用 中 都 需要 。 

3. 给 出 字典 或 多 重 字典 的 一 个 应 用 ， 它 需要 顺序 存 取 。 


10.2 ”抽象 数据 类 型 
ADT 10-1 是 抽象 数据 类 型 Dictionary。 其 中 p.first 和 p.second 分 别 表示 数 对 p 的 关键 字 
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和 值 。 当 字典 没有 与 关键 字 p.first 对 应 的 数 对 时 ， 插 和 人 操作 insert(p) 把 数 对 p 插 入 字典 ; 当 
字典 已 经 具有 与 关键 字 p.first 对 应 的 数 对 时 ， 用 新 的 值 取 代 旧 的 值 。 这 种 操作 方式 与 STL 容 
器 类 hash_map 的 方法 insert 一 致 。 





抽象 数据 类 型 Dictionary 
{ 
实例 
关键 字 各 不 相同 的 一 组 数据 对 
操作 
empty(): 返回 true， 当 且 仅 当 字 典 为 空 
size(): 返回 字典 的 数 对 个 数 
find(k): 返回 关键 字 为 上 的 数 对 
insert(p): 插入 数 对 p 
erase(h): 删除 关键 字 为 《的 数 对 








ADT 10-1 字典 的 抽象 数据 类 型 


程序 10-1 是 与 ADT 10-1 对 应 的 C++ 抽象 类 。 查 找 函 数 的 返回 值 是 指针 ， 指 向 与 给 定 的 
关键 字 相 匹配 的 数 对 。 这 与 STL 的 容器 类 hash_map 的 函数 find 一 致 。 

本 章 没 有 明确 讨论 对 多 重 字典 的 描述 方法 。 然 而 ， 对 非 多 重 字典 的 描述 方法 也 适用 于 它 。 
STL 中 的 类 hash_multimap 就 是 多 重 字 典 的 描述 方法 。 


程序 10-1 抽象 类 dictionary 


template<class K, class E> 
class dictionary 
{ 
PUBlics 
virtual ~dictionary() 1{} 
virtual bool empty() const = 0; 
// 返回 true， 当 且 仅 当 字典 为 空 
Virtual int size() const = 0; 
/返回 字典 中 数 对 的 数目 
virtual pair<const K, E>* find(const K&) const = 0; 
/返回 匹配 数 对 的 指针 
virtual void erase(const K&) = 0; 
/ 删除 匹配 的 数 对 
virtual void insert (Const pair<const K, E>&) = 0; 


1/ 往 字典 中 插入 一 个 数 对 


练习 

4. 列举 出 STL 类 hash_map 所 具有 而 抽象 类 dictionary 不 具有 的 方法 。 每 一 个 新 方法 的 功能 是 
什么 ? 

10.3 ”线性 表 描 述 


字典 可 以 保存 在 线性 表 (po p1… ) 中 ， 其 中 pg 是 字典 中 按 关键 字 递 增 次 序 排列 的 数 
对 。 为 了 适应 这 种 表示 方式 ， 可 以 定义 两 个 类 sortedArrayList 和 sortedChain。 前 者 用 数组 描 
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述 线 性 表 ( 见 5.3 节 )， 而 后 者 用 链表 描述 ( 见 6.1 节 )。 

练习 5 要 求 设计 sortedArrayList 类 。 它 可 以 折 半 查找 。 在 n 个 记录 的 字典 中 ， 查 找 操作 
的 时 间 为 O(logn)。 在 插入 时 ， 首 先 要 通过 查找 操作 来 确定 字典 中 没有 数 对 与 要 插入 的 数 对 具 
有 相同 关键 字 ; 然后 移动 数 对 ， 腾 出 插入 空间 。 需 要 移动 的 数 对 个 数 是 O(n)， 为 此 需要 的 时 
间 是 O(n)。 在 删除 时 ， 首 先 找到 要 删除 的 数 对 ， 然 后 删除 。 删 除 需要 移动 O(n) 个 记录 以 填补 
删除 后 的 空间 ， 为 此 需要 的 时 间 为 O(n)。 

程序 10-2、 程 序 10-3 和 程序 10-4 是 类 sortedChain 的 方法 find、insert 和 erase。sortedChain 
的 节点 是 pairNode 的 实例 。 和 chainNode ( 见 程序 6-1 ) 的 实例 一 样 ，pairNode 的 实例 有 两 个 
域 一 一 element 和 next， 它 们 的 类 型 分 别 是 pair<const K,E> 和 pairNode<K,E>*。 

使 用 类 sortedArrayList 或 sortedChain， 借助 相 应 的 迭代 器 ， 可 以 实现 对 字典 的 顺序 存 取 。 
按照 关键 字 的 递增 顺序 考察 每 一 个 数 对 的 时 间 是 8@(1)。 


程序 10-2 方法 sortedChain<K,E>::find 


template<class K, class E> 

pair<const K,E>* sortedChain<K,E>::find(const K& theKey) const 
{1/ 返回 匹配 的 数 对 的 指针 

1/ 如 果 不 存在 匹配 的 数 对 ， 则 返回 NULL 


pairNode<K,E>* currentNode = firstNode; 


1/ 搜索 关键 字 为 theKey 的 数 对 
while (currentNode != NULL && 
currentNode->element.first != theKey) 
currentNode = currentNode->next; 


/判断 是 否 匹配 
if (currentNode != NULL && currentNode->element.first == theKey) 
1/ 找 到 匹配 数 对 


return &currentNode->element; 


1// 无 匹配 的 数 对 
return NULL; 


程序 10-3 方法 sortedChain<K,E>::insert 


template<class K, class E> 
void sortedChain<K,E>::insert(const pair<const Kk, E>& thePair) 
{// 往 字 典 中 插入 thePair， 和 覆盖 已 经 存在 的 匹配 的 数 对 
pairNode<K,E> *p = firstNode, 
*tp = NULL; Wtp trails p 


// 移动 指针 tp, 使 thePair 可 以 插 在 tp 的 后 面 
while (p != NULL && p->element.first < thePair .first) 
{ 
tp = p; 
p = p->next:; 
} 


/检查 是 否 有 匹配 的 数 对 
if (P != NULL && P->elLlement .first == thePair,.first) 
{1/ 替换 旧 值 


P->element .second = thePair.second; 
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} 


1/ 无 匹配 的 数 对 ， 为 thePair 建立 新 节点 
pairNode<K,E> *newNode = new pairNode<K,E> (thePair, p); 


/在 tp 之 后 插入 新 节点 
if (tp == NULL) firstNode = newNode; 
else tp->next = newNode; 


QSize++7 
return; 





程序 10-4 方法 sortedChain<K,E>::erase 


template<class K, class E> 
void sortedChain<K,E>::erase (const K& theKey) 
LV/ 删除 关键 字 为 theKey 的 数 对 
pairNode<K,E> xp = firstNode, 
*tp = NULL; /l/tp trails p 





// 搜索 关键 字 为 LheKey 的 数 对 
While (P != NULL && P->element .first < theKevy) 
{ 
thi = Pr 
p = p->next’; 
} 


// 确定 是 否 匹 配 


if (p != NULL && p->element.first == theKey) 
{W 找到 一 个 匹配 的 数 对 
1/ 从 链表 中 删除 p 
if (tp == NULL) firstNode = p->next; //p 是 第 一 个 节点 


else tp->next = p->next,; 


delete p; 
SEZe==,; 


练习 


5. 用 数组 定义 C++ 类 sortedArrayList， 它 与 sortedChain 具有 相同 的 成 员 方法 。 编 写 和 测试 所 
有 函数 代码 。 

6. 用 一 个 具有 头 节 点 和 尾 节 点 的 链表 来 修改 类 sortedChain。 把 查找 、 插 入 或 删除 中 的 关键 字 
在 开始 处 存 人 尾 节点 ， 以 简化 代码 。 


10.4 跳 表 表 示 ( 可 选 ) 
10.4.1 理想 情况 


在 一 个 用 有 序 链表 描述 的 n 个 数 对 的 字典 中 进行 查找 ， 至 多 需要 n 次 关键 字 比 较 。 如 果 
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在 链表 的 中 部 节点 加 一 个 指针 ， 则 比较 次 数 可 以 减少 到 mw2+1。 这 时 ， 为 了 查找 一 个 数 对 ， 首 
先 与 中 间 的 数 对 比较 。 如 果 查 找 的 数 对 关键 字 比 较 小 ， 则 仅 在 链表 的 左 半 部 分 继续 查找 ， 否 
则 ， 在 链表 右 半 部 分 继续 查找 。 

例 10-4 图 10-1a 的 有 序 链表 有 7 个 数 对 。 该 链表 增加 了 一 个 头 节点 和 一 个 尾 节点 。 节 
点 中 的 数 是 关键 字 。 对 该 链表 的 搜索 可 能 最 多 要 进行 7 次 关键 字 比 较 。 如 果 像 图 10-1b 所 示 
的 那样 ， 在 中 间 的 节点 中 加 入 一 个 指针 ,那么 可 以 把 最 坏 情 况 下 的 比较 次 数 减少 为 4 次 。 为 
了 查找 一 个 关键 字 ， 首 先 将 它 与 中 间 数 对 的 关键 字 比 较 ， 然 后 根据 比较 结果 决定 ， 是 继续 在 
链表 的 左 半 部 查找 ， 还 是 继续 在 右 半 部 查找 。 例 如 ， 假 定 查找 关键 字 为 26 的 数 对 。 首 先 和 中 
间 的 关键 字 40 比较 ， 因 为 26<40， 所 以 下 面 需要 查找 40 左边 的 记录 。 如 果 要 查找 关键 字 75 
的 记录 ， 那 么 在 与 40 比较 之 后 ， 要 继续 查找 40 以 后 的 记录 。 图 


日 = 四- 四 时 -0 导 ~ 时 -9 寺 ~ 末 寺 -四 村 加] 


a) 带 有 头 节 点 和 尾 节 点 的 链表 











headerNode tailNode 











b) 中 间 节 点 的 指针 


EE Ee 
| ->|20| =|24| -=30| 二 >|40| 十 >|60| 十 >75 80 


c) 每 两 个 节点 增加 一 个 指针 























d) 查找 77 时 遇 到 的 最 后 一 个 指针 








(本 让 
| 


e) 插入 77 
图 10-1 一 个 有 序 链表 的 快速 搜索 


也 可 以 像 图 10-1c 一 样 ， 分 别 在 链表 左 半 部 分 和 右 半 部 分 的 中 间 节 点 中 增加 一 个 指针 ， 
以 进一步 减少 最 坏 情 况 下 的 比较 次 数 。 该 图 有 三 级 链表 。0 级 链表 是 图 10-1a 的 初始 链表 ， 包 
插 了 所 有 7 个 数 对 。1 级 链表 包括 字典 的 第 二 、 四 、 六 个 数 对 ， 而 2 级 链表 只 包括 第 四 个 数 
对 。 为 了 查找 关键 字 为 30 的 记录 ， 首先 用 2 级 链表 查找 ， 所 需要 时 间 为 9(1)。 因 为 30<40， 
所 以 要 在 链表 左 半 部 分 用 1 级 链表 查找 ， 所 需 时 间 为 6(1)。 又 因为 30>24， 所 以 要 用 0 级 链 
表 与 24 的 下 一 个 数 对 比较 。 

来 看 另 一 个 例子 。 查 找 关键 字 为 77 的 数 对 。 首 先 与 40 比较 ， 因 为 77>40， 所 以 在 1 级 
链表 中 与 75 比较 。 因 为 77>75， 所 以 在 0 级 链表 中 与 75 后 面 的 80 比较 。 这 时 可 以 得 知 77 
不 在 字典 中 。 采 用 图 10-1c 的 3 级 链表 结构 ， 所 有 查找 至 多 需 3 次 比较 。3 级 链表 结构 允许 在 
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有 序 链表 中 进行 折 半 查找 。 

对 nn 个 数 对 而 言 ，0 级 链表 包括 所 有 数 对 ，1 级 链表 每 2 个 数 对 取 一 个 ，2 级 链表 每 4 个 
数 对 取 一 个 ，i 级 链表 每 2' 个 数 对 取 一 个 。 一 个 数 对 属于 i 级 链表 ， 当 且 仪 当 它 属于 0 ~ i 级 
链表 ,但 不 属于 it1 级 ( 若 该 链表 存在 ) 链表 。 在 图 10-1c 中 ， 关 键 字 为 40 的 数 对 是 2 级 链 
表 唯 一 的 数 对 ， 而 关键 字 为 24 和 75 的 数 对 属于 1 级 链表 元 素 。 关 键 字 分 别 为 20、30、60、 
80 的 数 对 属于 0 级 链表 。 

我 们 把 诸如 图 10-1c 的 结构 称 为 跳 表 。 在 该 结构 中 有 一 组 等 级 链表 。0 级 链表 包含 所 有 
数 对 ，1 级 链表 的 数 对 是 0 级 链表 数 对 的 一 个 子 集 。i 级 链表 的 数 对 是 i-1 级 链表 数 对 的 子 集 。 
图 10-1c 是 跳 表 的 一 个 规则 结构 ，i 级 链表 所 有 的 数 对 均 属于 i-1 级 链表 。 


10.4.2 ”插入 和 删除 


在 插入 和 删除 时 ， 要 保持 图 10-1c 跳 表 的 规则 结构 ， 需 要 耗 时 O(n)。 在 规则 的 跳 表 结构 
中 ,i 级 链表 有 mw2 个 记录 ， 在 插入 时 要 尽量 允 近 这 种 结构 。 插 入 的 新 数 对 属于 i 级 链表 的 概 
率 为 1/2'。 在 实际 确定 新 数 对 所 属 的 链表 级 别 时 ， 应 考虑 各 种 可 能 的 情况 。 把 新 数 对 插入 i 级 
链表 的 可 能 性 为 p?， 在 图 10-1c 中 ,p=0.5。 对 一 般 的 p， 链 表 的 级 数 为 |log,,n|+ 1。 在 一 个 规 
则 的 跳 表 中 ，i 级 链表 包含 1/p 个 于 1 级 链表 的 节点 。 

假定 插入 关键 字 为 77 的 数 对 。 首 先 通 过 搜索 来 确定 链表 没有 这 个 数 对 。 在 搜索 中 ， 我 们 
用 到 了 关键 字 为 40 的 节点 中 一 个 2 级 链表 指针 、 关 键 字 为 75 的 节点 中 一 个 1 级 链表 的 指针 
和 一 个 0 级 链表 的 指针 。 在 图 10-1d 中 ,这 几 个 指针 被 一 条 虚线 切 制 。 新 数 对 插入 位 置 在 75 
和 80 之 间 ， 如 图 10-1d 的 虚线 所 示 。 

在 插入 时 ， 要 为 新 数 对 分 配 一 个 级 ( 即 确定 它 属于 哪 一 级 链表 )， 分 配 过 程 由 后 面 将 要 介 
绍 的 随机 数 生 成 器 来 完成 。 若 新 数 对 属于 i 级 链表 ， 则 插 和 人 结果 仅 影 响 由 虚线 切割 的 0 ~ i 级 
链表 指针 。 图 10-1e 是 插入 77 的 结果 。 

对 删除 操作 ， 我 们 无 法 控制 结构 。 要 删除 图 10-1e 的 节点 77， 首 先 要 找到 77。 然 后 所 遇 
到 的 链表 指针 是 节点 40 中 的 2 级 链表 指针 、 节 点 75 中 的 1 级 链表 指针 和 0 级 链表 指针 。 因 
为 77 为 1 级 链表 中 数 对 的 关键 字 ， 所 以 只 需 改 变 0 级 和 1 级 链表 指针 即 可 。 当 使 这 些 指针 指 
向 77 后 面 的 节点 时 ， 就 得 到 图 10-1d 的 结构 。 


10.4.3 级 的 分 配 


在 规则 的 跳 表 结构 中 ，i-1 级 链表 的 数 对 个 数 与 i 级 链表 的 数 对 个 数 之 比 是 一 个 分 数 p。 
因此 ， 属 于 i-1 级 链表 的 数 对 同时 属于 i 级 链表 的 概率 为 p。 假 设 用 一 个 统一 的 随机 数 生 成 器 
产生 0 和 1 间 的 实数 ， 产 生 的 随机 数 <p 的 概率 为 p。 阁 下 一 个 随机 数 < p， 则 新 数 对 应 在 1 
级 链表 上 。 要 确定 该 数 对 是 否 在 2 级 链表 上 ， 要 由 下 一 个 随机 数 来 决定 。 若 新 的 随机 数 < p， 
则 该 元 素 也 属于 2 级 链表 。 重 复 这 个 过 程 ， 直 到 一 随机 数 >p 为 止 。 

这 种 方法 有 潜在 的 缺点 ， 某 些 数 对 被 分 配 的 级 数 可 能 特别 大 ， 远 远 超过 log1/,N， 其 中 
NN 为 字典 数 对 的 最 大 预期 数目 。 为 避免 这 种 情况 ， 可 以 设 定 一 个 级 数 的 上 限 maxLevel， 最 大 
值 为 

[logwV1-1 (10-1 ) 

这 种 方法 还 有 一 个 缺点 ， 即 使 采用 了 级 数 的 上 限 maxLevel， 还 可 能 出 现 这 样 的 情况 : 在 
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插入 一 个 新 数 对 之 前 有 3 个 链表 ， 而 在 插入 之 后 就 有 了 10 个 链表 。 也 就 是 说 ， 尽 管 3 ~ 8 级 
链表 没有 数 对 ， 新 数 对 却 被 分 配 到 9 级 链表 。 换 句 话 说 ,在 插入 前 后 ,没有 3 ~ 8 级 链表 。 
因为 这 些 空 级 链表 并 没有 什么 好 处 ,我们 可 以 把 新 记录 的 链表 等 级 调整 为 3。 

例 10-5 用 跳 表 描述 一 个 最 多 有 1024 个 数 对 的 字典 。 设 p=0.5， 则 maxLevel 为 
logz1024-1=9。 假 定 从 一 个 空 字典 开始 ， 用 一 个 具有 头 节点 和 尾 节 点 的 跳 表 结构 描述 ， 头 节 


点 有 10 个 指针 ， 每 个 指针 对 应 一 条 链表 ， 且 从 头 节点 指向 尾 节点 。 
当 插入 第 一 个 数 对 时 ， 为 其 在 0 ~ 9 之 间 分 配 一 个 等 级 。 若 分 配 的 等 级 为 9， 则 因为 跳 
表 还 没有 0 ~ 8 级 的 记录 ， 所 以 可 以 把 等 级 改 为 0， 这 时 只 需 修 改 一 个 指针 即 可 。 国 


还 有 另 一 种 等 级 分 配方 法 ， 把 随机 数 生 成 器 产生 的 数 分 为 几 段 。 第 一 段 是 1 ~ 1/p， 第 二 
段 是 Lp ~ 1/p*?， 等 等 。 若 产生 的 随机 数 出 现在 第 i 段 ， 则 把 数 对 插入 i-1 级 链表 。 


10.4.4 结构 skipNode 


跳 表 结构 的 头 节 点 需 有 足够 的 指针 域 ， 以 满足 最 大 链表 级 数 的 构建 需要 ， 而 尾 节点 不 需 
要 指针 域 。 每 个 存 有 数 对 的 节点 都 有 一 个 存储 数 对 的 element 域 和 个 数 大 于 自身 级 数 的 指针 
域 。 程 序 10-5 的 结构 skipNode 可 以 满足 所 有 类 型 的 节点 需要 。 


程序 10-5 ”结构 skipNode 


template <class K, class E> 
struct skipNode 
{ 
typedef pair<const K, E> pairType; 


pairType element; 
skipNode<K, E> **next; 1/ 指针 数组 


”SkipPNode (Const pairTypeg& thePair，int size) 
:element {thePair) {next = new skipNode<K,E>* [size];} 


】} 





指针 域 由 数组 next 表示， 其 中 next[] 表示 ii 级 链表 指针 。 构 造 图 数 把 字典 数 对 存 人 
element 域 ， 为 指针 数组 分 配 空 间 。 对 一 个 lev 级 链表 数 对 ， 其 size 值 应 为 lev+1。 


10.4.5 类 skipList 


1. 类 skipList 的 数据 成 员 
程序 10-6 是 类 skipList 的 数据 成 员 。 每 一 个 数据 成 员 的 意义 由 它 的 名 称 和 附加 的 解释 来 
说 明 。 


程序 10-6 ”类 skipList 的 数据 成 员 


float cutOff; 1/ 用 来 确定 层 数 

int levels; / 当前 最 大 的 非 空 链表 
int dSize; 1/ 字典 的 数 对 个 数 
int maxLevel; 1/ 允许 的 最 大 链表 层 数 
K tailKey; /最 大 关键 字 
skipNode<K, E>* headerNode; 1/ 头 节点 指针 
skipNode<K, E>* tailNode; 咱 晨 节点 指针 


skipNode<K, E>** last; /1/1last[i] 表示 立 层 的 最 后 节点 
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2. 类 skipList 的 构造 函数 

程序 10-7 是 类 skipList 的 构造 函数 。 参 数 largeKey 的 值 大 于 字典 的 任何 数 对 的 关键 字 ， 
它 存储 在 尾 节 点 。 参 数 maxPairs 的 值 是 字典 数 对 个 数 的 最 大 数 。 虽 然 代 码 允 许字 典 数 对 个 数 
大 于 maxPairs， 但 是 如 果 不 超 过 maxPairs， 程 序 的 性 能 会 更 好 ， 因 为 链表 级 数 是 由 maxPairs 
替代 了 公式 (10-1 ) 中 的 入 之 后 决定 的 。 参 数 prob 的 值 是 i-1 级 链表 数 对 同时 也 是 i 级 链表 
数 对 的 概率 。 构 造 函 数 初始 化 类 skipList 的 数据 成 员 ， 也 为 头 节点 、 尾 节点 和 数组 last 分 配 空 
间 。 在 插入 和 删除 之 前 的 搜索 时 所 遇 到 的 每 级 链表 的 最 后 一 个 数 对 指针 都 存储 在 数组 last 中 。 
跳 表 初始 布局 为 空 ， 头 节点 有 maxLevel+1l 个 指向 尾 节点 的 指针 。 构 造 函 数 的 时 间 复 杂 度 为 


O(maxLevel), 


程序 10-7 ”构造 函数 





template<class K, class E> 

skipList<K,E>::skipList(K largeKey, int maxPairs, foat prob) 

{1/ 构造 函数 ， 关 键 字 小 于 largeKey 且 数 对 个 数 size 最 多 为 maxPairs。0 < prob < 1 
CutOff = prob * RAND MAX; 


maxLevel = (int) ceill(logf((float) maxPairs) / logf(1l/prob)) - 1; 
levels = 0; 1/ 初始 化 级 数 
dSize = 0; 


tailKey = largeKey; 


1/ 生成 头 节 点 、 尾 节点 和 数组 last 

pair<K,E> tailPair; 

tailPpair.first = tailKey; 

headerNode = new skipNode<K,E> (tailPair, maxLevel + 1); 
tailNode = new skipNode<K,E> (tailPair, 0); 

last = new skipNode<K,E> *[maxLevel+1]; 


/链表 为 空 时 ， 任 意 级 链表 中 的 头 节点 都 指向 尾 节点 
for (int i = 0; i <= maxLevel; i++) 
headerNode->next[i] = tailNode; 
} 


3. 方法 skipList<K,E>::find 

程序 10-8 是 方法 find 的 代码 。 如 果 关 键 字 为 theKey 的 数 对 不 存在 ， 则 返回 值 是 NULL， 
和 否则， 返回 值 是 该 数 对 的 指针 。 

find 从 最 高 级 链表 ( 即 levels 级 链表 ， 它 只 有 一 个 数 对 ) 开始 查找 ， 直 到 0 级 链表 。 在 
每 一 级 链表 中 ， 从 左边 尽 可 能 逼近 要 查找 的 记录 。 虽 然 在 找到 关键 字 等 于 thekey 的 数 对 时 ， 
可 能 在 ;级 就 终止 搜索 ,但 是 用 来 检验 是 否 相 等 的 额外 比较 操作 是 不 必要 的 ， 因 为 大 部 分 这 
样 的 数 对 都 只 出 现在 0 级 链表 。 当 从 for 循环 退出 时 ， 指 针 正 好 处 在 要 查找 的 数 对 左边 。 与 0 
级 链表 的 下 一 个 数 对 比较 ， 即 可 确定 要 查找 的 数 对 是 否 在 跳 表 中 。 


程序 10-8 ”skipList<K,E>::find 方法 
template<class K, class E> 
pair<const K,E>* skipList<K,E>::find(const Kg theKey) const 
{/ 返回 匹配 的 数 对 的 指针 
/ 如 果 没 有 匹配 的 数 对 ， 返 回 NULL 
if (theKey >= tailKey) 
return NULL; /1/1 没 有 可 能 的 匹配 的 数 对 
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// 位 置 beforeNode 是 关键 字 为 theKey 的 节点 之 前 最 右边 的 位 置 
skipNode<K, E>* beforeNode = headerNode; 
for (int i = levels; i >= 0; i--) 1// 从 上 级 链表 到 下 级 链表 
1// 跟踪 i 级 链表 指针 
while (beforeNode->next[i]->element,.first < theKey) 
beforeNode = beforeNode->next[il]; 


1/ 检查 下 一 个 节点 的 关键 字 是 否 是 theKey 
IE (beforeNode->next[0]->element.first == theKey) 
return &beforeNode->next[0]->element; 


return NULL; /无 匹配 的 数 对 


4. 方法 SkipList<K,E>::insert 

在 编写 插入 代码 之 前 ， 不 仅 要 编写 级 的 分 配 函 数 ， 为 新 数 对 指定 它 所 属 的 级 链表 ， 而 
且 要 编写 搜索 函数 search， 以 存储 在 每 一 级 链表 搜索 时 所 遇 到 的 最 后 一 个 节点 的 指针 。 程 序 
10-9 和 程序 10-10 分 别 是 它们 的 代码 。 


程序 10-9 ”级 的 分 配方 法 


template<class K, class E> 
int skipList<K,E>::level() const 
{/ 返回 一 个 表示 链表 级 的 随机 数 ， 这 个 数 不 大 于 maxLevel 
int lev = 0; 
while (rand() <= cutOff) 
levt+} 


return (lev <= maxLevel) ? lev : maxLevel; 


程序 10-10。 搜索 并 把 在 每 一 级 链表 搜索 时 所 过 到 的 最 后 一 个 节点 指针 存储 起 来 


template<class K, class E> 
SkipNode<K,E>* skipList<K,E>::search(const K& theKey) const 
{/ 搜索 关键 字 theKey， 把 每 一 级 链表 中 要 查看 的 最 后 一 个 节点 存储 在 数组 last 中 
// 返回 包含 关键 字 theKey 的 节点 
// 位 置 peforeNode 是 关键 字 为 theKey 的 节点 之 前 最 右边 的 位 置 
SkipNode<K,E>* beforeNode = headerNode; 
for (int i = levels; i >= 0; 1i--) 
' 
while (beforeNode->next[i]->element.first < theKey) 
beforeNode = beforeNode->next [i]; 
last[i] = beforeNode; 1 最 后 一 级 链表 二 的 节点 
} 
return beforeNode->next[01]; 


} 





程序 10-11 是 跳 表 的 插入 代码 。 当 最 大 的 关键 字 largeKey 不 大 于 新 数 对 thePair 的 关键 字 
thePair.first 时 ( largeKey 友 thePair.first )， 不 执行 插入 。 如 果 跳 表 存 在 一 个 数 对 其 关键 字 等 于 
thePair.first， 则 把 这 个 数 对 的 值 修 改 为 thePairsecond。 





日 ”程序 10-10 原 书 有 误 ， 这 里 修改 了 该 程序 。 一 一 译 者 注 
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程序 10-11 跳 表 插 入 


template<class Kk, class E> 
void skipList<K,E>::insert(const pair<const K, E>& thePpair) 
{// 把 数 对 thePair 插入 字典 ， 覆盖 其 关键 字 相同 的 已 存在 的 数 对 


if (thePair.first >= tailKey) // 关键 字 太 大 
{ostringstream s; 
S << Key = " 去 < thePair. first << “ Must be < " << tailkKey? 


throw illegalParameterValue(s.str()); 
} 


1/ 查看 关键 字 为 theKey 的 数 对 是 否 已 经 存在 
skipNode<K,E>* theNode = search (thePair.first);} 
if (theNode->element.first == thePair.first) 
{1/ 车 存在 ， 则 更 新 该 数 对 的 值 
theNode->element.second = thePair.second; 
return; 


} 


1/ 若 不 存在 ， 则 确定 新 节点 所 在 的 级 链表 
int theLevel = level ()， // 新 节点 的 级 
// 使 级 theLevel 为 <= Levels + 1 
if (theLevel > levels) 
{ 
theLevel = ++levels; 
last[theLevel] = headerNode; 


1/ 在 节点 theNode 之 后 插入 新 节点 
skipNode<K,E>* newNode = new skipNode<K,E> (thePair，theLevel + 1); 
for (int i = 0; i <= theLevel; i++) 


{1/ 插入 i 级 链表 


newNode->next[i] = last[i]->next[i]; 
last[i]->next[i] = newNode; 

} 

dSizet++; 

return’; 





5. skipList<K.,E>::erase 
程序 10-12 的 代码 是 删除 关键 字 为 theKey 的 数 对 。while 循环 用 来 修改 levels 的 值 ， 除 非 
跳 表 为 空 。 否则 levels 不 会 成 为 0。 


程序 10-12 ”删除 跳 表 的 记录 


template<class K, class E> 
void skipList<K,E>::erase(const Kg theKey) 


{// 删除 关键 字 等 于 theKey 的 数 对 


if (theKey >= tailKey) 1/ 关键 字 太 大 
return; 

// 查看 是 否 有 匹配 的 数 对 

SkipNode<K,E>* theNode = search (上 theKeYy) : 

if (theNode->element.first != theKey) /不 存在 


return; 
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/ 从 跳 表 中 删除 节点 
for (int i = 0; i <= levels && 
last[i]->next[i] == theNode; i++) 
last[i]->next[i] = theNode->next[i]; 


/更 新 链表 级 
while (levels > 0 && headerNode->nextL[levelsl == tailNode) 
levels-—;} 


delete theNode; 
dSize--—;} 
} 


6. 其 他 方法 

关于 size 和 empty 方法 ， 还 有 迭代 器 方法 ， 它 们 的 代码 与 链表 chain 中 相应 的 方法 的 代码 
相似 。 记 住 ， 每 一 级 链表 的 节点 ( 不 包含 头 节 点 ， 因 为 它 没有 关键 字 ) 都 是 按照 关键 字 递 增 顺 
序 排列 的 。 因 此 ，skipList 的 迭代 器 可 以 提供 顺序 访问 方法 ， 访 问 每 一 节点 的 时 间 是 8@(1)。 


10.4.6 ”skipList 方法 的 复杂 度 


当 字 典 有 nn 个 数 对 时 ， 查 找 (find )、 插 入 (insert)、 删 除 (erase ) 操作 的 时 间 复 杂 度 
均 为 O(n+maxLevel)。 在 最 坏 情 况 下 ， 可 能 只 有 一 个 maxLevel 级 数 对 ， 余 下 所 有 数 对 均 在 0 
级 链表 上 。i > 0 时 ， 在 ;级 链表 上 花费 的 时 间 为 O(maxLevel)， 在 0 级 链表 上 花费 的 时 间 为 
O(n)。 尽 管 最 坏 情 况 下 的 性 能 较 差 ， 但 跳 表 仍 不 失 为 一 种 有 价值 的 数据 描述 方法 ， 因 为 查找 、 
插入 、 删 除 的 平均 复杂 度 均 为 O(logn)， 不 过 其 证 明 超 出 了 本 书 的 范围 。 

至 于 空间 复杂 度 ， 在 最 坏 情 况 下 每 一 个 记录 都 可 能 是 maxLevel 级 ， 都 需要 maxLevel+1 
个 指针 。 因 此 ， 除 了 需要 存储 n 个 数 对 的 空间 ， 还 需要 存储 O(n*maxLevel) 个 指针 的 空间 。 
不 过 ,一般 情况 下 ，1 级 链表 有 n*p 个 数 对 ，2 级 链 有 mn*p? 个 记录 ,i 级 链 有 n*p' 个 记录 。 因 
此 指针 域 的 平均 值 ( 不 包括 头 、 尾 节点 的 指针 ) 是 nip=n/(1-p)。 看 来 ,虽然 最 坏 情况 下 的 
空间 需求 比较 大 ， 但 平均 的 空间 需求 并 不 大 。 当 p=0.5 时 ,平均 空间 需求 ( 加 上 nn 个 数 对 指 
针 ) 大 约 是 2n 个 指针 空间 。 


练习 


7. 编写 一 个 级 的 分 配 程序 ， 采 用 本 文 所 介绍 的 策略 ， 把 随机 数 的 取 值 范 围 划分 为 若干 段 ， 然 
后 根据 随机 数 所 属 的 段 来 分 配 链表 的 级 。 

8. 修改 类 skipList， 人 允许 不 同 的 数 对 具有 相同 的 关键 字 。 每 个 级 链表 的 节点 按 从 左 到 右 按 关键 
字 非 递减 次 序 排 列 。 测 试 你 的 代码 。 

9. 扩充 类 skipList， 增 加 删除 方法 ， 删 除 关键 字 最 小 的 节点 ， 删 除 关 键 字 最 大 的 节点 。 计 算 每 
个 方法 的 复杂 度 ? 


10.5 ” 散 列 表 描述 


10.5.1 理想 散 列 
字典 的 另 一 种 表示 方法 是 散 列 (hashing )。 它 用 一 个 散 列 函数 ( 也 称 哈 希 函 数 ) 把 字典 
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的 数 对 映射 到 一 个 散 列 表 ( 也 称 哈 希 表 ) 的 具体 位 置 。 如 果 数 对 p 的 关键 字 是 k， 散 列 函 数 为 
f/f， 那么 在 理想 情况 下 ,pp 在 散 列 表 中 的 位 置 为 1(K)。 暂 时 假定 散 列表 的 每 一 个 位 置 最 多 能 够 
存储 一 个 记录 。 为 了 搜索 关键 字 为 的 数 对 ， 先 要 计算 f(K)， 然 后 查看 在 散 列表 的 f(A) 处 是 
否 已 有 一 个 数 对 。 如 果 有 ， 便 找到 了 该 数 对 。 如 果 没 有 ， 字典 就 不 包含 该 数 对 。 在 前 一 种 情 
况 下 ， 可 以 删除 该 数 对 ， 为 此 只 需 使 散 列 表 的 f(h) 位 置 为 空 。 在 后 一 种 情况 下 ， 可 以 把 该 数 
对 插 在 f(h) 的 位 置 。 

例 10-6 考察 例 10-1 的 学 生 记 录 字 典 。 假 设 不 用 学 生 名 ， 而 是 用 6 位 整数 的 学 生 ID 
号 作为 关键 字 。 在 一 个 班 中 ,假设 最 多 有 100 个 学 生 ， 他 们 的 ID 号 在 951 000 和 952 000 
之 间 。 函 数 f(D=k-951 000 把 学 生 ID 号 映射 到 散 列 表 的 位 置 0 到 1000 之 间 。 可 以 用 数组 
table[1001] 来 存储 字典 记录 的 指针 。 数 组 table 的 初始 化 是 table[] 为 NULL, 0 < i< 1000。 
为 了 查找 关键 字 为 的 记录 ， 我 们 计算 7(k)=k-951 000。 如 果 table[/UD] 不 等 于 NULL， 那 么 
该 记录 就 在 table[f()] 中 。 如 果 table[f( 有 )] 等 于 NULL， 那 么 字典 没有 该 记录 。 在 后 一 种 情况 
下 ， 可 以 把 该 记录 插入 相应 位 置 。 在 前 一 种 情况 下 ， 可 以 令 table[f(j)] 为 NULL， 从 而 删除 该 
记录 。 国 

在 刚刚 描述 的 理想 情况 下 ， 初 始 化 一 个 空 字典 需要 的 时 间 为 0(5) (4 为 散 列表 拥有 的 位 
置 数 )， 查 找 、 插 人 、 删 除 操作 的 时 间 均 为 6(1)。 

尽管 理想 的 散 列 方法 用 在 许多 字典 的 应 用 中 ， 但 是 还 有 许多 应 用 ， 因 为 关键 字 变化 范围 
太 大 ， 使 散 列表 没有 意义 或 不 切实 际 。 

例 10-7 假设 在 例 10-1 的 学 生 记 录 字 典 中 学 生 I 有 D 号 的 范围 是 [100 000,999 999]， 散 列 
函数 是 f(h)=k-100 000。 因 为 的 值 域 是 [0,899 999]， 所 以 散 列表 要 具有 900 000 个 位 置 。 对 
一 个 仅 有 100 名 学 生 的 学 生 清单 ， 使 用 如 此 长 的 散 列 表 是 不 明智 的 。 不 仅 浪 费 存储 空间 ， 而 
且 要 把 900 000 个 数组 元 素 初 始 化 为 NULL， 也 需要 很 长 的 时 间 。 国 

例 10-8[ 把 字符 串 转 换 为 唯一 的 数值 ] 设想 一 本 字典 的 关键 字 是 三 个 字符 。 例 如 每 个 关 
键 字 用 名 字 的 起 始 字母 表示 ， 则 Mohandas Karamchand Gandhi 的 关键 字 是 MKG。 

因为 每 个 字符 在 C++ 中 占 工 字 节 的 存储 空间 ， 所 以 用 程序 10-13 可 以 把 一 个 长 度 为 3 的 
字符 串 转 换 为 一 个 长 整 型 数 。 


程序 10-13 ”把 一 个 长 度 为 3 的 字符 串 转换 为 一 个 长 整 型 数 


long threeToLong (string s) 
{/ 假设 s.Length() >= 3 
/最 左边 的 字符 


long answer = s.at (0); 


/ 左 移 8 位， 加 入 下 一 个 字符 


answer = (answer << 8) + s.at (1); 


// 左 移 8 位 ， 加 入 下 一 个 字符 
return (answer << 8) + s.at (2); 


} 


当 s=abc，s.charAt(0)=a，s.charAt(1)=b，s.charAt(2)=c 时 ， 如 果 把 a、b 和 cc 的 每 一 个 字 
符 都 转换 为 一 个 整数 ， 那 么 结果 分 别 是 97、98 和 99。 在 程序 10-13 的 左 移 8 位 的 操作 中 ， 一 
个 字符 的 位 值 不 会 影响 男 一 个 字符 的 位 值 。 因 此 ，3 字符 构成 的 串 不 同 ， 转 换 的 长 整 型 数 也 
不 同 ， 这 就 可 以 用 threeToLong(s) 的 值 重 建 字符 串 ( 见 练习 12 )。 
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因 为 一 个 左 移 8 位 的 操作 等 价 于 乘 以 28-=256， 所 以 程序 10-13 的 计算 等 价 于 
((97*256+98)*256)+99=6 382 179。 

虽然 程序 10-13 把 每 一 个 长 度 为 3 的 字符 串 转 换 成 唯一 的 长 整 型 数 ,， 但 是 长 整 型 数 的 范 
围 是 [0.22-1]。 国 


10.5.2 ” 散 列 函数 和 散 列 表 


1. 桶 和 起 始 桶 

当 关 键 字 的 范围 太 大 ， 不 能 用 理想 方法 表示 时 ， 可 以 采用 并 不 理想 的 散 列表 和 散 列 函数 : 
散 列 表 位 置 的 数量 比 关键 字 的 个 数 少 ， 散 列 函 数 把 若干 个 不 同 的 关键 字 映 射 到 散 列 表 的 同一 
个 位 置 。 散 列表 的 每 一 个 位 置 叫 一 个 桶 (bucket ); 对 关键 字 为 上 的 数 对 ，f(A 是 起 始 桶 ( home 
bucket ) ; 桶 的 数量 等 于 散 列表 的 长 度 或 大 小 。 因 为 散 列 函 数 可 以 把 若干 个 关键 字 映 射 到 同一 
个 桶 ， 所 以 桶 要 能 够 容纳 多 个 数 对 。 本 章 我 们 考虑 两 种 极端 情况 。 第 一 种 情况 是 每 一 个 桶 只 
能 存储 一 个 数 对 。 第 二 种 情况 是 每 一 个 桶 都 是 一 个 可 以 容纳 全 部 数 对 的 线性 表 。 

2. 除法 散 列 函数 

在 多 种 散 列 函数 中 ， 最 常用 的 是 除法 散 列 函数 ， 它 的 形式 如 下 : 

FUD=kohD (10-2 ) 

其 中 上 是 关键 字 ，D 是 散 列表 的 长 度 ( 即 桶 的 数量 )，% 为 求 模 操 作 符 。 散 列表 的 位 置 索引 
从 0 到 D-1。 当 D=11 时 ， 与 关键 字 3、22、27、40、80 和 96 分 别 对 应 的 起 始 桶 是 f3)=3， 
f(22)=0, f(27)=5, f(40)=7, f(80)=3 和 f(96)=8。 

其 他 的 散 列 函数 在 本 书 网 站 上 给 出 。 

3. 冲突 和 溢出 

图 10-2a 的 散 列 表 有 11 个 桶 ， 序 号 从 0 到 10， 而 且 每 一 个 桶 可 以 存储 一 个 数 对 。 图 中 只 
显示 了 关键 字 。 除 数 刀 为 11。 因 为 80%11=3， 则 80 的 位 置 为 3，40 的 位 置 为 40%11=7，65 
的 位 置 为 65%11=10。 每 个 数 对 都 在 相应 的 起 始 桶 中 。 散 列表 余下 的 桶 为 空 。 » 

现在 假设 要 插入 58。58 的 起 始 桶 为 f(58)=58%11=3。 这 个 桶 已 被 另 一 个 关键 字 占 用 。 这 
时 就 发 生 了 冲突 。 当 两 个 不 同 的 关键 字 所 对 应 的 起 始 桶 相同 时 ， 就 是 冲突 ( collision ) 发 生 
了 。 因 为 一 个 桶 可 以 存储 多 个 数 对 ， 因 此 发 生 碰撞 也 没什么 了 不 起 。 只 要 起 始 桶 足够 大 ， 所 
有 对 应 同一 个 起 始 桶 的 数 对 都 可 存储 在 一 起 。 如 果 存 储 桶 没有 空间 存储 一 个 新 数 对 ， 就 是 溢 


出 (overflow ) 发 生 了 。 
在 我 们 的 例子 中 ， 每 个 桶 只 能 存 | | | [wl | fs 
储 一 个 数 对 ， 因 此 碰撞 和 溢出 同时 发 tablel] "” '， “ ”4567 8 9 1 
生 。 如 果 58 不 能 放 在 起 始 桶 ， 那 么 放 
到 哪里 呢 ? 这 个 问题 由 洲 出 处 理 方法 来 
解决 。 最 常用 的 方法 是 线性 探查 法 ( 见 
10.5.3 节 )。 其 他 方法 ,例如 平 法 探查 法 zablell 
和 双重 散 列 法 ， 都 在 本 书 网 站 上 给 出 。 
4. 我 需要 一 个 好 的 散 列 函数 4 180， 8 | 
单 就 冲突 而 言 并 不 可 怕 ， 可 怕 的 是 | 
它 会 带 来 溢出 ， 除 非 一 个 桶 可 以 容纳 无 0) 
限 多 个 数 对 ， 和 否则 插入 时 的 溢出 就 不 是 图 10-2 散 列表 





a) 





jsf] | lol | | 
2 和 


b) 


0 1 


10 
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那么 容易 解决 的 问题 了 。 当 映射 到 散 列表 中 任何 一 个 桶 里 的 关键 字数 量 大 致 相等 时 ， 冲 突 和 
溢出 的 平均 数 最 少 。 均 匀 散 列 函 数 ( uniform hash function ) 便 是 这 样 的 函数 。 

例 10-9[ 均匀 散 列 函数 ] 假定 散 列 有 4b 个 桶 ， 且 b>1， 桶 的 序号 从 0 到 4b-1。 如 果 对 
所 有 的 k， 散 列 函 数 f(AD=0， 那 么 f(A) 就 不 是 一 个 均匀 散 列 函 数 ， 因 为 它 把 所 有 的 关键 字 都 
映射 到 一 个 0 号 桶 里 。 这 样 的 散 列 函数 使 冲突 和 谥 出 的 数量 最 大 。 假 设 b=11， 关 键 字 范围 
为 [0,98]。 一 个 均匀 散 列 函数 应 该 把 大 约 每 9 个 关键 字 映 射 到 一 个 桶 里 。 如 果 关 键 字 范围 为 
[0,999]， 那 么 它 应 该 把 大 约 每 91 个 关键 字 映 射 到 一 个 桶 里 。 

函数 f(A)=k%2b 对 范围 [0,r] 内 的 关键 字 是 均匀 散 列 函数 ， 其 中 + 是 正 整数 。 例 如 ， 当 
/=20 和 b=11 时 ,一些 桶 有 2 个 关键 字 ， 另 一 些 桶 有 1 个 关键 字 。 当 "=50 和 b=11 时 ， 一 些 桶 
有 5 个 关键 字 ， 另 一 些 桶 有 4 个 关键 字 。 一 般 来 说 ， 只 要 r 和 4b 大 于 1， 那么 一 些 桶 有 |x/b] 
个 关键 字 ， 男 一 些 桶 有 [x/b| 个 关键 字 。 除 法 产生 均匀 散 列 函数 。 画 

如 果 要 从 关键 字 范 围 内 均匀 地 选择 一 组 关键 字 ， 那 就 要 用 均匀 散 列 函数 。 遗 憾 的 是 ， 我 
们 没有 说 明 如 何 使 用 这 种 方法 。 在 应 用 中 ， 字 典 关 键 字 都 有 某 种 程度 的 关联 性 。 例 如 ， 当 关 
键 字 是 整数 时 ， 可 能 是 奇数 占 优 或 偶数 占 优 ， 不 会 是 奇数 和 偶数 均等 。 当 关键 字 是 字母 数字 
形式 的 时 候 ， 前 级 或 后 级 相同 的 关键 字 可 能 会 扎堆 儿 。 在 实际 应 用 中 ， 关 键 字 不 是 从 关键 字 
范围 内 均匀 选择 的 ， 因 此 有 的 均匀 散 列 函数 表现 好 一 点 ， 有 一 些 就 差 一 些 。 那 些 在 实际 应 用 
中 性 能 表现 好 的 均匀 散 列 函数 被 称 为 良好 散 列 函数 ( good hash function )。 

例 10-10[ 选择 散 列 函数 的 除数 D] 当 散 列 函 数 f(h)=k%D ( D=b ) 时 ， 对 于 DD 的 选择 ， 
有 些 会 产生 良好 散 列 函数 ， 有 些 会 产生 不 良 散 列 函 数 。 但 是 只 要 D>1， 对 DD 的 所 有 选择 ， 都 
会 产生 均匀 散 列 函数 。 

假设 D 是 偶数 。 当 是 偶数 时 ， f(D 是 偶数 ; 当 k 是 奇数 时 ，f(h) 是 奇数 。 例 如 52620， 
当天 是 偶数 时 为 偶数 ， 当 上 是 奇数 时 为 奇数 。 如 果 你 的 应 用 以 偶数 关键 字 为 主 ， 那 么 大 部 分 
关键 字 都 被 映射 到 序号 为 偶数 的 起 始 桶 里 。 如 果 你 的 应 用 以 奇数 关键 字 为 主 ， 那 么 大 部 分 关 
键 字 都 被 映射 到 序号 为 奇数 的 起 始 桶 里 。 因 此 , 选择 也 为 偶数 ， 得 到 的 是 不 良 散 列 函数 。 

当 刀 可 以 被 诸如 3、5 和 7 这 样 的 小 奇数 整除 时 ， 不 会 产生 良好 散 列 函数 。 因 此 ， 要 使 
除法 散 列 函数 成 为 良好 散 列 函 数 ， 你 要 选择 的 除数 DD 应 该 既 不 是 偶数 又 不 能 被 小 的 奇数 整 
除 。 理 想 的 万 是 一 个 素数 。 当 你 不 能 用 心算 找到 一 个 接近 散 列 表 长 度 的 素数 时 ， 你 应 该 选择 
不 能 被 2 和 19 之 间 的 数 整 除 的 D。 选 择 DD 时 的 其 他 考量 在 10.5.3 节 和 10.5.4 节 中 讨论 。 ”四 

因为 在 实际 应 用 的 字典 中 ， 关 键 字 是 相互 关联 的 ， 所 以 你 所 选择 的 均匀 散 列 函数 ， 其 值 
应 该 依赖 关键 字 的 所 有 位 ( 而 不 是 仅仅 取决 于 前 几 位 ， 或 后 几 位 ， 或 中 间 几 位 )。 本 书 网 站 上 
的 散 列 函数 具有 这 样 的 性 质 ， 因 此 它们 都 是 良好 散 列 函数 。 当 使 用 除法 散 列 函数 时 ， 选 择 除 
数 DD 为 奇数 ， 可 以 使 散 列 值 依赖 关键 字 的 所 有 位 。 当 D 既是 素数 又 不 能 被 小 于 20 的 数 整 除 ， 
就 能 得 到 良好 散 列 函数 。 

5. 除法 和 非 整 型 关键 字 

为 使 用 除法 散 列 函数 ， 在 计算 ,Ab 之 前 ， 需 要 把 关键 字 转 换 为 非 负 整 数 。 因 为 所 有 散 列 
函数 都 把 若干 个 关键 字 散 列 到 相同 的 起 始 桶 ， 所 以 没有 必要 把 关键 字 转 换 为 统一 的 非 负 整数 。 
只 要 把 串 数 据 、 结 构 和 算法 转换 为 相同 的 整数 就 可 以 了 。 

例 10-11[ 把 字符 串 转换 为 整数 ] 程序 10-13 不 能 扩展 到 把 任意 长 度 的 字符 串 关 键 字 转 
换 为 数值 ， 因 为 长 整 型 仅 有 32 位 。 现 在 没有 必要 把 字符 串 转 换 为 唯一 的 非 负 整数 ， 因 此 可 以 
把 每 一 个 字符 串 ， 不 论 多 长 ， 转 换 为 一 个 16 位 整数 。 程 序 10-14 是 这 样 做 的 一 种 方法 。 
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程序 10-14 ”把 一 个 字符 串 转 换 为 一 个 不 唯一 的 整数 
Ent. StringToIrnt (String 8) 


{1/ 把 s 转换 为 一 个 非 负 整 数 ， 这 种 转换 依赖 s 的 所 有 字符 


int length = (int) s.length(); 1 s 中 的 字符 个 数 
int answer = 0; 
if (length $% 2 == 1) 
{1/ 长 度 为 奇数 
answer = s.at (length - 1); 
length-——; 
} 
1/ 长 度 是 偶数 
for (int i = 0; i < length; i += 2) 
{// 同时 转换 两 个 字符 
answer += s.at (i); 
answer += ((int) s.at(i + 1)) << 8; 
} 
return (answer < 0) ? -answer : answer; 


} 





程序 10-14 使 用 程序 10-13 的 技术 ， 逐 对 儿 地 把 字符 转换 为 一 个 唯一 整数 ， 并 累计 求 和 。 
本 来 可 以 简单 地 把 所 有 字符 加 起 来 (不 用 每 隔 一 个 字符 做 一 次 左 移 8 位 的 操作 )， 得 到 的 整数 
不 会 超过 8 位 ， 即 使 长 度 为 8 的 字符 串 转换 为 整数 也 最 多 占 11 位 。 而 现在 的 移 位 操作 覆盖 了 
整数 的 所 有 位 ， 即 使 是 长 度 为 2 的 字符 串 。 国 

C++ 的 STL 中 的 模板 类 hash<T> 是 实现 散 列 的 一 个 专业 版 ， 它 把 类 型 为 T 的 实例 转换 为 
类 型 为 size t 的 非 负 整数 。 程 序 10-15 是 hash<T> 的 一 个 专业 版 ， 其 中 T 是 STL 串 。 这 个 特 
化 版 与 SGI STL 的 hash<char*> 是 一 致 的 。 


程序 10-15 ”专业 版 hash<string> 
template<> 
class hash<string> 
{ 
Public: 
Size t operator() (const string theKey) const 
{// 把 关键 字 theKey 转换 为 一 个 非 负 整数 
unsigned long hashValue = 0; 
int length = (int) theKey.length(); 
for (int i = 0; i < length; i++) 
hashValue = 5 * hashValue + theKey.at (i); 


return size t (hashValue); 


10.5.3 ”线性 探查 
1. 方法 


要 在 图 10-2a 的 散 列表 中 把 58 放 进 去 ， 最 简单 方法 是 找到 下 一 个 可 用 的 桶 。 这 种 解决 溢 
出 的 方法 叫 作 线性 探查 ( Linear Probing )。 
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58 因此 被 存储 在 4 号 桶 。 假 设 下 一 个 要 插入 的 数 对 关键 字 为 24, 24%11=2, 2 号 桶 为 空 ， 
于 是 把 24 放 入 2 号 桶 。 这 时 的 散 列表 如 图 10-2b 所 示 。 现 在 要 插入 35。35 的 起 始 桶 2 已 满 。 
用 线性 探查 ， 结 果 如 图 10-2c 所 示 。 最 后 一 例 ， 插入 98。 它 的 起 始 桶 10 已 满 ， 而 下 一 个 可 
用 桶 是 0 号 桶 ， 于 是 98 被 插入 在 此 。 由 此 看 来 ， 在 寻找 下 一 个 可 用 桶 时 ， 散 列表 被 视 为 环 

明白 了 怎样 用 线性 探查 法 进行 插入 的 过 程 ， 就 可 以 设计 散 列 表 的 搜索 方法 。 假 设 要 查找 
关键 字 为 的 数 对 ， 首 先 搜索 起 始 桶 了 (有 )， 然 后 把 散 列表 当做 环 表 继 续 搜 索 下 一 个 桶 ， 直 到 
以 下 情况 之 一 发 生 为 止 : 1 ) 存 有 关键 字 k 的 桶 已 找到 ， 即 找到 了 要 查找 的 数 对 ; 2 ) 到 达 一 
个 空 桶 ; 3 ) 又 回 到 起 始 桶 了 (A)。 后 两 种 情况 说 明 关键 字 为 的 数 对 不 存在 。 | 

删除 一 个 记录 要 保证 上 述 的 搜索 过 程 可 以 正常 进行 。 若 在 图 10-2c 中 删除 了 关键 字 58， 
不 能 仅仅 把 4 号 桶 置 为 空 ， 否 则 就 无 法 找到 关键 字 为 35 的 数 对 。 删 除 需要 移动 若干 个 数 对 。 
从 删除 位 置 的 下 一 个 桶 开始 ， 逐 个 检查 每 个 桶 ， 以 确定 要 移动 的 元 素 ， 直 至 到 达 一 个 空 桶 或 
回 到 删除 位 置 为 止 。 在 做 删除 移动 时 ， 一 定 要 注意 ， 不 要 把 一 个 数 对 移 到 它 的 起 始 桶 之 前 ， 
和 否则， 对 这 个 数 对 的 查找 就 可 能 失败 。 

实现 删除 的 另 一 个 策略 是 为 每 个 桶 增加 一 个 域 neverUsed。 在 散 列 表 初 始 化 时 ， 这 个 域 被 
置 为 tue。 当 一 个 数 对 存 人 一 个 桶 中 时 ，neverUsed 域 被 置 为 false。 现 在 ， 搜 索 的 结束 条 件 2 ) 
变 成 : 桶 的 neverUsed 域 为 tue。 不 过 在 删除 时 ， 只 是 把 表 的 相应 位 置 置 为 空 。 一 个 新 元 素 被 
插入 在 其 对 应 的 起 始 桶 之 后 所 找到 的 第 一 个 空 桶 中 。 注 意 ， 在 这 种 方案 中 ，neverUsed 不 会 重 
新 置 为 tue。 用 不 了 多 长 时 间 ， 所 有 (或 几乎 所 有 ) 桶 的 neverUsed 域 都 等 于 false， 这 时 搜索 
是 否 失败 ， 只 有 检查 所 有 的 桶 之 后 才 可 以 确定 。 为 了 提高 性 能 ， 当 很 多 空 桶 的 neverUsed 域 等 
于 false 时 ， 必 须 重新 组 织 这 个 散 列 表 。 例 如 ， 可 把 所 有 余下 的 数 对 都 插 到 一 个 空 的 散 列表 中 。 

2. 线性 探查 的 C++ 实现 

程序 10-16 是 散 列表 类 hashTable 的 数据 成 员 和 构造 消 数 ， 这 个 类 使 用 了 线性 探查 法 。 注 
意 ， 散 列表 用 一 维 数组 table[] 表示 ， 类 型 为 pair<const K,E>*。 


程序 10-16 ”hashTable 的 数据 成 员 和 构造 函数 
1/ 散 列表 的 数据 成 员 


pair<const K, E>** table; 1/ 散 列 表 

hash<K> hash; 1/ 把 类 型 Kk 了 映射 到 一 个 非 整 数 
int dSize; 1/ 字典 中 数 对 个 数 

int divisor; // 散 列 函数 除数 

// 构造 函数 


template<class K, class E> 
hashTable<K,E>: :hashTable(int theDivisor) 
{ 

divisor = theDivisor; 

dSsize = 0:; 


/ 分 配 和 初始 化 散 列 表 数 组 

table = new pair<const K, E>* [divisor]; 

for (int i = 0; i < divisor; i++) 
table[i] = NULL; 
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程序 10-17 给 出 了 hashTable 的 搜索 函数 search。 函 数 的 返回 值 是 一 个 桶 的 序号 b， 它 满 
足 如 下 三 种 情形 之 一 ，1 ) table[b] 是 一 个 指针 ， 指 向 关键 字 为 theKey 的 数 对 ; 2 ) 散 列表 没 
有 关键 字 为 theKey 的 数 对 ，table[b]=NULL， 需 要 时 ， 可 以 把 关键 字 为 theKey 的 数 对 插 到 b 
号 桶 ; 3 ) 散 列表 没有 关键 字 为 theKey 的 数 对 ， 但 是 table[b] 不 是 NULL，table[b] 的 关键 字 
不 是 theKey， 而 且 表 已 满 。 


程序 10-17 hashTable<K,E>::search 


template<class K, class E> 

int hashTable<K,E>::searchl(const K& theKey) const 
{/1/ 搜索 一 个 公开 地 址 散 列 表 ， 查 找 关键 字 为 theKey 的 数 对 

// 如 果 匹 配 的 数 对 存在 ， 返 回 它 的 位 置 ， 否则 ， 如 果 散 列表 不 满 ， 
// 则 返回 关键 字 为 theKey 的 数 对 可 以 插入 的 位 置 


int i = (int) hash(theKey) % divisor; // 起 始祖 
EE 9 // 从 起 始 桶 开始 
do 
{ 

if (table[j] == NULL || tablel[j]->first == theKey) 

return j; 

j= (jj + 1) S$ divisor; 1/ 下 一 个 桶 
} while (3 != i); /是 否 返回 到 起 始 桶 ? 
return j; 1/ 表 满 


} 


程序 10-18 实现 了 查找 函数 hashTable<K ,E>::find。 


程序 10-18 hashTable<K,E>::find 


template<class K, class E> 
Pair<const K,E>* hashTable<K,E>::find(const Ké& theKey) const 
{1/ 返回 匹配 数 对 的 指针 
// 如 果 匹 配 数 对 不 存在 ， 返 回 NULL 
1/ 搜索 散 列表 


int b = search (theKey) : 


1// 判断 table[b] 是 否 是 匹配 数 对 


if (table[b] == NULL || table[b]->first != thekey) 
return NULL; 1/ 没有 找到 
return table[b]; // 找到 匹配 数 对 


} 


程序 10-19 是 insert 函数 的 实现 代码 。 它 首先 调用 搜索 函数 search。 根 据 search 函数 的 说 
明 ， 如 果 返 回 的 b 号 桶 是 空 的 ， 则 表 中 没有 关键 字 为 thePair.first 的 数 对 ， 该 数 对 thePair 可 以 
插 到 该 桶 中 。 考 返回 的 桶 非 空 ， 则 要 么 在 表 中 已 存在 关键 字 为 thePairfirst 的 数 对 ， 要 么 表 已 
满 。 在 前 一 种 情况 下 ， 把 该 桶 中 的 数 对 值 改 为 thePair.second。 在 后 一 种 情况 下 ， 抛 出 一 个 异 
常 。 练 习 26 要 求 编写 erase 函数 的 代码 。 


程序 10-19 hashTable<K,E>::insert 


template<class K, class E> 
void hashTable<K,E>::insert(const pair<const K, E>& thePair) 
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{/ 把 数 对 thePair 插入 字典 . 车 存 在 关键 字 相同 的 数 对 ， 则 巴 盖 
// 若 表 满 ， 则 抛 出 异常 
1/ 搜索 散 列表 ， 查 找 匹 配 的 数 对 
int b = search (thepair.first); 
// 检查 匹配 的 数 对 是 否 存在 
iE (table[lb] == NULL) 
{ 
// 没有 匹配 的 数 对 ， 而 且 表 不 满 
table[lb] = new pair<const K,E> (thePaiz) 
GSize++?} 
} 
else 
{1// 检查 是 否 有 重复 的 关键 字数 对 或 是 否 表 满 
if (table[b]->first == thePair.first) 
{1// 有 重复 的 关键 字数 对 ， 修 改 table [b]->second 
table[b]->second = thePpair.second; 
]} 
else 1/ 表 满 
throw hashTableFull (); 


} 


3. 性 能 分 析 

我 们 只 分 析 时 间 复 杂 度 。 设 b 为 散 列 表 的 桶 数 ， 为 散 列 函数 的 除数 ， 且 b=D。 散 列表 
初始 化 的 时 间 为 0(5)。 当 表 中 及 个 记录 时 ， 最 坏 情况 下 的 插入 和 查找 时 间 均 为 G6(n)。 当 所 
有 关键 字 都 对 应 同一 个 起 始 桶 时 ， 便 是 最 坏 情况 。 把 字典 的 散 列 在 最 坏 情 况 下 的 复杂 度 与 线 
性 表 在 最 坏 情 况 下 的 复杂 度 相 比较 ， 二 者 完全 相同 。 

然而 ， 就 平均 性 能 而 言 ， 散 列 远 远 优 于 线性 表 。 令 U,, 和 分 别 表示 在 一 次 成 功 搜索 和 
不 成 功 搜索 中 平均 搜索 的 桶 数 ， 其 中 是 很 大 的 值 。 这 个 平均 值 是 由 插入 的 个 关键 字 计 算 
得 来 的 。 对 于 线性 探查 ， 有 如 下 近似 公式 : 

a. | (10-3 ) 


(10-4 ) 


其 中 a=n/b 为 负载 因子 (loading factor )。 公 式 (10-3 ) 得 来 不 易 ， 但 是 公式 (10-4 ) 可 以 从 公 
式 (10-3 ) 比较 容易 地 推导 出 来 。 

从 公式 (10-3 ) 和 公式 (10-4) 可 以 证 明 ， 当 a=0.5 时 ， 一 次 不 成 功 的 搜索 将 平均 查找 
2.5 个 桶 ， 一 次 成 功 的 搜索 将 平均 查找 1.5 个 桶 。 当 a=0.9 时 ， 这 些 数字 分 别 为 50.5 和 5.5。 
当然 ， 这 时 假定 n 比 51 大 得 多 。 当 负载 因子 比较 小 时 ， 使 用 线性 探查 ， 散 列 的 平均 性 能 比 线 
性 表 的 平均 性 能 要 优越 许多 。 一 般 情 况 下 都 是 a < 0.75。 

4. 随机 探查 分 析 

为 了 知道 在 确定 U, 和 5 的 时 候 都 用 到 哪些 知识 ,我 们 从 随机 探查 法 处 理 溢出 的 过 程 
中 来 推导 U, 和 5 的 公式 。 在 随机 探查 中 ， 当 溢出 发 生 时 ， 以 随机 的 方式 为 新 数 对 寻找 插 
人 位 置 (在 实际 应 用 中 ， 用 随机 数 生成 器 产生 一 个 桶 的 搜索 序列 ， 然 后 用 这 个 序列 去 确定 
插入 位 置 )。 
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公式 的 导出 使 用 了 下 面 概率 论 定理 的 结果 。 
定理 10-1 设 疡 是 划一 事件 发 生 的 概率 。 为 了 该 事件 发 生 ， 独 立 试验 的 期 望 次 数 是 1/p。 
为 理解 定理 10-1 的 意义 ， 假 定 掷 一 枚 硬币 ， 硬 币 正 面 落 地 的 概率 是 p=1/2， 为 此 你 希望 
投掷 的 次 数 是 1p=2。 一 个 鹏 子 有 6 面 ， 从 1 到 6。 当 你 投 吉 子 时 ， 出 现 奇数 的 概率 是 p=1/2， 
为 此 你 希望 投掷 的 次 数 是 1p=2。 出 现 6 的 概率 是 p=1/6， 为 此 你 希望 投掷 的 次 数 是 1/p=6。 
U, 公式 按 如 下 方式 导出 ， 当 装载 因子 是 a 时 ， 一 个 桶 有 数 对 的 概率 是 K， 没 有 数 对 的 概 
率 为 p=1-a。 在 随机 探查 中 ,使 用 一 个 独立 试验 序列 进行 搜索 ， 一 次 失败 的 搜索 是 找到 一 个 
空 桶 ， 为 此 ， 我 们 期 望 搜索 的 桶 数 是 
wx = 二 = 下 二 (10-5 ) 
5 公式 可 以 从 局 公式 推导 出 来 。 按 照 插 入 顺序 ， 给 散 列 表 的 二 个 记录 编号 为 1， 
n。 当 插入 第 i 个 数 对 时 ， 首 先 通过 一 次 不 成 功 的 搜索 找到 一 个 空 桶 ， oe 
空 桶 里 。 在 插入 第 i 个 数 对 时 ， 装 载 因 子 是 (i-1)/bp， 其 中 4b 是 桶 数 。 从 公式 ( 10-5 ) 得 出 , 在 
搜索 第 i 个 桶 时 ， 查 看 的 期 望 桶 数 是 
1 
1-1 5 
i J 


= 二 > 一 二 = 二 
TS ~ nl ix 

















es (10-6 ) 


就 需要 查看 的 桶 数 而 言 ， 线 性 探查 的 性 能 不 如 随机 探查 。 例 如 ， 当 a=0.9 时 ， 使 用 线性 
探查 进行 一 次 不 成 功 的 搜索 而 期 望 查看 的 桶 数 是 50.5， 而 用 随机 探查 时 ， 这 个 数 降 到 10。 那 
么 我 们 为 什么 不 使 用 随机 探查 呢 ? 有 下 面 两 个 原因 : 

e 真正 影响 运行 时 间 的 不 是 要 查看 的 桶 数 。 计 算 一 个 随机 数 比 查看 若干 个 桶 更 需要 

时 间 。 
e 随机 探查 是 用 随机 方式 搜索 散 列表 ， 高 速 缓存 使 运行 时 间 增 大 。 因 此 ， 尽 管 随机 探查 
需要 查看 的 桶 数 要 比 线性 探查 少 ， 但 是 它 实际 使 用 的 时 间 很 多 ， 除 非 装载 因子 接近 1。 

5. 选择 一 个 除数 DD 

为 了 确定 D 的 值 ， 我 们 首先 要 确定 ， 对 成 功 的 搜索 和 不 成 功 的 搜索 而 言 ， 什 么 样 的 性 能 
是 可 以 接受 的 。 使 用 UV, 和 5 的 公式 ， 可 以 确定 a 的 最 大 值 。 根据 n 的 值 (或 是 一 个 估计 值 ) 
和 a 的 计算 值 ， 可 以 确定 5 的 最 小 许可 值 。 下 面 我 们 来 寻找 一 个 至 少 和 值 b 一样 大 的 整数 ， 
它 或 是 一 个 素数 ， 或 是 一 个 不 能 被 小 于 20 的 数 整 除 的 数 。 这 个 整数 可 以 用 作 D 和 54。 的 值 。 

例 10-12 设计 一 个 可 容纳 近 1000 个 数 对 的 散 列表 。 要 求 成 功 搜索 时 的 平均 搜索 桶 数 
不 得 超过 4， 不 成 功 搜索 时 的 平均 搜索 桶 数 不 得 超过 50.5。 由 Ui 的 公式 ,得 到 a < 0.9， 由 
5S 的 公式 ， 得 到 4 二 0.5+1/(2(1-0)) 或 a < 6/7。 因 此 ，a < min{0.9,6/7}=6/7。 因 此 5 最 小 为 
[7n/6]= 1167 。p=D=1171 是 一 个 合适 的 值 。 

另 一 种 计算 DD 的 方法 是 ， 根 据 散 列表 可 用 空间 的 最 大 值 来 确定 b 的 最 大 可 能 值 ， 然 后 取 
D 为 不 大 于 的 最 大 整数 ， 而 且 要 么 是 素数 ， 要 么 不 能 被 小 于 20 的 数 整除 。 例 如 ， 如 果 散 列 
表 最 多 有 530 个 桶 ， 则 23*23=529 是 D 和 的 最 佳 选 择 。 
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10.5.4” 链 式 散 列 


1. 记 法 

如 果 散 列表 的 每 一 个 桶 可 以 容纳 无 限 多 个 记录 ,那么 溢出 问题 就 不 存在 了 。 实 现 这 个 目 
标的 一 个 方法 是 给 散 列 表 的 每 一 个 位 置 配置 一 个 线性 表 。 这 时 ， 每 一 个 数 对 可 以 存储 在 它 的 
起 始 桶 线性 表 中 。 现 在 我 们 来 考察 每 一 个 桶 都 是 有 序 链表 的 情况 。 图 10-3 是 这 种 散 列 表 的 一 
个 例子 ， 散 列 函 数 的 除数 是 11。 


table 
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图 10-3 ” 链 式 散 列 表 


为 搜索 关键 字 值 为 的 记录 ， 首 先 计算 其 起 始 桶 ，k%D， 然 后 搜索 该 桶 所 对 应 的 链表 。 
为 插入 一 个 记录 ， 首 先 要 保证 散 列 表 没 有 一 个 记录 与 该 记录 的 关键 字 相 同 ， 为 此 而 进行 的 搜 
索 仅 限于 该 记录 的 起 始 桶 所 对 应 的 链表 。 要 删除 一 个 关键 字 为 大 的 记录 ， 我 们 要 搜索 它 所 对 
应 的 起 始 桶 链表 ， 找 到 该 记录 ， 然 后 删除 。 

2. 链 式 散 列 表 的 C++ 实现 

类 hashChains 用 一 组 table[0:divisor-1] 实现 字典 ， 数 组 元 素 类 型 是 sortedChain<K,E> ( 见 
10.3 节 )。 程 序 10-20 是 类 hashChains 的 一 些 重要 方法 。 


程序 10-20 hashChains 的 一 些 方法 


template<class K, class E> 
pair<const Kk, E>* find(const K& theKey) const 
{return table[hash (theKey) % divisor].find(theKey);} 


void insert(const pair<const K, E>& thePpair) 
{ 
int homeBucket = (int) hash (thePair.first) % divisor; 
int homeSize = table[homeBucket] .size(); 
table[homeBucket] .insert (thePpair); 
if (table[homeBucket].size() > homeSize) 
dSizett+} 


} 


void erase (const K& theKey) 
{table[hash (theKey) % divisor] .erase (theKey);} 
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3. 一 种 改进 的 实现 方法 

在 图 10-4 的 每 个 链表 上 增加 一 个 尾 节 点 ， 可 以 改进 一 些 程序 的 性 能 。 尾 节点 的 关键 字 值 
最 起 码 要 比 插 人 的 所 有 数 对 的 关键 字 都 大 。 在 图 10-4 中 ， 尾 节点 的 关键 字 用 来 表示 。 在 实 
际 应 用 中 ， 当 关键 字 为 整数 时 ， 可 以 用 limits.h 文件 中 定义 的 INT_MAX 常量 来 奉 代 wm。 有 
了 尾 节 点 ， 就 可 以 省 去 在 sortedChain 的 方法 中 出 现 的 大 部 分 对 空 指针 的 检验 操作 。 注意 ,在 
图 10-4 中 ， 每 个 链表 都 有 不 同 的 尾 节点 ， 而 实际 上 ， 所 有 链表 可 共用 一 个 尾 节点 。 
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表示 大 的 关键 字 
图 10-4 和 带 尾 节点 的 链 式 散 列表 





4. 与 线性 探查 比较 

把 线性 探查 与 不 带 尾 节 点 的 链 式 散 列 做 明确 比较 。 首 先 考察 空间 需求 。 假 设 一 个 指针 需 
要 2 字 节 ， 一 个 字典 数 对 需要 * 字 节 。 在 线性 探查 的 实现 中 ，2 个 桶 的 散 列 需要 24 字 节 空间 ， 
n 个 数 对 需要 sn 字 节 空间 。 当 使 用 有 序 链表 时 ， 我 们 需要 b 个 firstNode 指针 空间 、 个 dSize 
变量 空间 、n 个 数 对 空间 入 n 个 next 指针 空间 。 假 设 一 个 整 型 占 2 字 节 ， 总 空间 是 4b+(s+2)n 
字 节 。 两 个 分 析 都 忽略 了 数据 成 员 hashTable 和 hashChains 的 空间 ， 这 些 空间 的 大 小 独立 于 4 
和 nn。 线 性 探查 需要 的 空间 是 2b+sn 字 节 ， 小 于 有 序 链 式 散 列 需要 的 空间 。 

在 最 坏 情况 下 ， 用 两 种 方法 进行 搜索 时 ， 都 要 考察 所 有 n 个 关键 字 。 使 用 链 式 散 列 时 一 
次 搜索 不 成 功 和 成 功 的 平均 性 能 分 别 用 U, 和 8, 表示。 它们 也 可 以 在 线性 探查 中 使 用 ， 只 要 
把 桶 数 记 成 节点 数 。U, 和 5， 可 用 如 下 方法 计算 。 对 一 条 有 i 个 节点 的 有 序 链 表 ， 一 次 不 成 功 
搜索 可 能 要 检查 1，2，3,，…, 或 i 个 节点 ， 其 中 i 1。 考 虑 图 10-3 的 链表 table[3]。 搜 索 
一 个 小 于 36 的 关键 字 需 要 检查 一 个 节点 ; 搜索 一 个 大 于 36 小 于 69 的 关键 字 要 检查 两 个 节点 。 
对 于 i 个 节点 的 链表 ， 有 i+1 种 可 能 的 范围 使 搜索 关键 字 失 败 。 若 每 种 可 能 的 概率 相同 ， 则 一 
次 不 成 功 搜索 需要 检查 的 节点 数 为 : 


1 1 二 人 天 +D 玫 二 
rs a 

其 中 i > 1。 当 i-0 时 ， 平均 检查 的 节点 数 为 0。 对 于 链 式 散 列 ， 假 定 链表 的 平均 长 度 为 

mb-a。 当 a > 1 时 ,可 用 a 代替 上 面 公式 中 的 i， 从 而 得 到 ; 


_ aa+3) a=1 (10-7 ) 
”~ 2(g+1) 


当 a<1 时 ， 由 于 链表 的 平均 长 度 为 a 搜索 次 数 不 可 能 比 节点 数 多 ， 因 此 U, < a。 
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计算 5;, 时 ,需要 知道 n 个 标志 符 距 其 链表 头 节点 的 平均 距离 。 为 了 计算 距离 ， 假 设 各 标 
志 符 是 按 升序 插入 的 。 这 个 假设 并 不 影响 标志 符 在 各 自 链 表 中 的 位 置 。 当 插入 第 i 个 标志 
时 ， 其 所 在 链表 的 平均 长 度 为 (i-1)/bp。 由 于 标志 符 按 升序 插入 ， 所 以 第 i 个 标志 : 符 被 插入 相 
应 链表 的 尾部 。 因 此 对 该 标志 符 的 搜索 需 检 查 1+(i-1)/b 个 节点 。 还 要 注意 ， 当 标志 符 按 升序 
插入 时 ， 它 距 链 表 头 节点 的 距离 并 不 随 着 以 后 的 插入 操作 而 改变 。 假 定 n 个 标志 符 中 每 一 个 
被 搜索 的 概率 都 相同 ， 则 有 


5. =>{1+0- Db} 1+ 志 -~1+ 委 (10-8 ) 


把 采用 链表 时 的 性 能 公式 与 采用 线性 和 随机 探查 时 的 性 能 公式 比较 ， 可 以 看 到 ， 从 平 
均 数 上 看 ,使 用 链表 时 要 检查 的 节点 数 比 使 用 线性 和 随机 探查 时 要 检查 的 桶 数 少 。 例 如 ， 当 
a=0.9 时 ， 在 链 式 散 列 中 ， 一 次 不 成 功 搜索 平均 要 检查 0.9 个 节点 ， 而 一 次 成 功 搜索 平均 要 检 
查 1.45 个 节点 。 男 一 方面 ， 在 线性 探查 中 ， 不 成 功 搜索 时 需要 检查 50.5 个 桶 ， 成 功 搜索 时 需 
要 检查 5.5 个 桶 。 

5. 与 跳 表 比较 

跳 表 和 散 列 均 使 用 了 随机 过 程 来 提高 字典 操作 的 性 能 。 在 使 用 跳 表 时 ,插入 操作 用 随机 

过 程 来 决定 一 个 数 对 的 级 。 级 的 分 配对 于 要 插入 的 数 对 不 考虑 其 关键 字 。 在 使 用 散 列 时 ， 散 
列 函 数 给 不 同 数 对 分 配 的 桶 是 随机 分 布 的 。 散 列 函 数 利用 待 插 入 数 对 的 关键 字 。 

通过 使 用 随机 过 程 ， 跳 表 和 散 列 操作 的 平均 复杂 度 分 别 是 对 数 级 和 常数 级 。 跳 表 方 法 的 
最 坏 时 间 复 杂 度 为 @(s+maxLeveD) ， 而 散 列 的 最 坏 时 间 复 杂 度 为 9(n)。 跳 表 中 指针 平均 占用 
的 空间 约 为 maxLevel+n/(1-p) ; 最 坏 情况 需要 maxLevel*(n+1) 个 指针 空间 。 就 最 坏 情况 下 的 
空间 需求 而 言 ， 跳 表 远 远大 于 链 式 散 列 。 链 式 散 列 需要 的 指针 空间 为 D+n。 

不 过 ， 跳 表 比 散 列 更 灵活 。 例 如 ， 只 需 简单 地 沿 着 0 级 链 就 可 以 在 线性 时 间 内 按 关 键 字 
升序 输出 所 有 的 元 素 。 使 用 链 式 散 列 时 ， 需 要 BCD) 时 间 去 收集 最 多 DD 个 非 空 链表 ， 男 外 需 
要 O(nlogD) 时 间 把 有 序 链表 按 关键 字 升序 合并 。 合 并 过 程 如 下 : 1 ) 把 链表 放 到 一 个 队列 中 ; 
2 ) 从 队列 中 提取 一 对 链表 ， 把 它们 合并 为 一 个 有 序 链表 ， 然 后 放 人 队列 ; 3 ) 重复 步骤 2 )， 
直至 队列 中 仅 剩 一 个 链表 。 其 他 的 操作 ， 如 查找 或 删除 其 关键 字 最 大 或 最 小 的 数 对 ， 使 用 散 
列 也 要 花费 更 多 的 时 间 ( 仅 考 虑 平均 复杂 度 )。 


练习 


10. 用 理想 散 列 来 实现 字典 的 C++ 类。 假设 关键 字 是 介 于 0 ~ maxKey 之 间 的 整数 ，maxKey 

是 在 创建 字典 时 由 用 户 指定 的 。 测 试 你 的 代码 。 
1. 令 au 和 vv 是 两 个 不 同 的 字符 串 ， 长 度 为 3。 证 明 ， 程 序 10-13 把 它们 转换 为 不 同 的 数字 。 

12. 编写 一 个 函数 ， 它 把 程序 10-13 的 返回 值 转变 为 原来 的 字符 串 。 

13. 在 下 列 说 明 的 散 列 函数 中 ， 哪 一 个 是 均匀 散 列 函数 (2 为 散 列 表 中 桶 的 数量 )? 并 说 明 原 因 。 
1 ) 关键 字 是 [0,999] 内 的 整数 ，b=50，f(h)=k%47。 
2 ) 关键 字 是 [0,999] 内 的 偶数 ，b=70，f(k)=k%70。 
3 ) 关键 字 是 [0,999] 内 的 奇数 ，b=70，Jf(k)=k9%70。 
4 ) 关键 字 是 取 自 英语 字母 表 的 三 个 小 写字 母 ，b=70，f( 有 )= 关键 字 大 的 第 一 个 字母 。 

14. 一 个 散 列表 有 5 个 桶 ， 散 列 函 数 是 f(D=k%b。 下 列 一 组 5 值 哪 一 个 符合 例 10-10 中 对 除数 
的 要 求 ” 即 哪 一 个 可 以 给 我 们 带 来 良好 散 列 函数 ? 
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un 


bs 
pe | 


1 ) b=93 
2,) b=37 

3 ) b=1024 
4) b=529 


. 按照 例 10-11 后 面 提出 的 建议 ,编写 一 个 函数 ， 把 一 个 字符 串 转 换 为 一 个 整数 。 即 使 大 多 


数字 符 是 ASCII 码 ， 且 字符 串 并 不 长 ， 该 函数 也 应 该 覆盖 正 整 数 范围 。 


. 编写 一 个 函数 ， 把 一 个 双 浮 点 数 转 换 为 一 个 可 以 用 作 除 法 散 列 函数 的 整数 。 
. 使 用 线性 探查 ， 散 列表 的 桶 数 5=13， 散 列 函 数 了 (hk)=k%b。 从 空 表 开 始 插 入 ， 关 键 字 依次 


.为 7、42、25、70、14、38、8、21、34、11。 请 按 关 键 字 顺序 插入 。 


呈 一 
\D % 


2 


jh 


2 
2 


LO iD 


24. 


2 


LA 


26. 


27. 


1 ) 每 插 人 一 个 关键 字 ， 画 一 张 图 。 

2 ) 插入 最 后 一 个 关键 字 之 后 ， 装 载 因子 是 多 少 ? 

3 ) 在 一 次 失败 的 搜索 中 ， 最 多 和 平均 查找 的 桶 数 各 是 多 少 ? 

4) 在 一 次 成 功 的 搜索 中 ， 最 多 和 平均 查找 的 桶 数 各 是 多 少 ? 

5 ) 使 用 你 的 装载 因子 和 线性 探查 公式 (10-3 ) 和 公式 ( 10-4 )， 计 算 U, 和 5;。 如 何 把 它 
们 的 值 与 3) 和 4) 的 值 比较 ?解释 它们 的 差别 。 


.在 5=17 的 条 件 下 做 练习 17。 
.在 6=27 的 条 件 下 做 练习 17。 
20. 


设计 一 个 实验 ,确定 U 公式 和 5; 公式 对 线性 探查 的 精确 度 。 进 行 实 验 后 把 实验 结果 呈现 
在 一 个 表 中 ， 包含 测 量 值 和 计算 值 。 


. 1) 由 公式 (10-3 ) 推导 出 公式 ( 10-4 )。 用 相同 的 方法 由 公式 ( 10-5 ) 推导 出 公式 ( 10-6 )。 


2 ) 可 以 用 这 种 方法 从 公式 (10-7 ) 推导 出 公式 (10-8 ) 吗 ? 为 什么 ? : 


. 为 线性 探查 和 随机 探查 设计 一 个 表 ， 记 录 a=0.1, 0.2, 0.3,…, 0.9 条 件 下 的 UU 和 5, 的 值 。 
.采用 线性 探查 ,分 别 在 下 列 每 一 种 情况 下 ， 为 散 列 函数 的 除数 D 确定 合适 的 值 。 


1) n=50, 5 < 3, Ui; 20s 

2 ) n=500; $7 5, U; < 60。 

3) n=10, 5 2 WW 10s 

分 别 在 下 列 每 一 种 条 件 下 ， 为 散 列 函 数 的 除数 DD 确定 合适 的 值 。 对 这 样 的 吃 值 ， 确 定 5， 
和 U 为 n 的 函数 。 假 设 采 用 线性 探查 。 

1) MaxElements < 530。 

2 ) MaxElements < 130。 

3 ) MaxElements < 150。 


. 为 程序 10-19 的 方法 hashTable<K,E>::insert 编写 另 一 个 版 本 。 每 当 装 载 因子 超过 用 户 指 


定 的 值 时 ， 表 长 就 近似 地 加 倍 。 这 个 装载 因子 是 在 散 列 表 初 始 化 时 和 初始 容量 一 起 指定 
的 。 明 确 地 讲 ， 表 的 长 度 是 奇数 ( 除数 也 是 奇数 ) ; 每 当 装 载 因子 超 值 时 ， 新 的 表 长 为 
2*#(oldtablesize)+1。 虽 然 这 种 方法 不 是 按照 我 们 指定 的 规则 选择 除数 的 ， 但 是 这 种 方法 避 
免 了 用 偶数 做 除数 ， 而 且 容 易 实现 。 

编写 方法 hashTable<K,E>::erase 的 代码 。 不 要 改变 hashTable 的 任何 成 员 。 计 算 代码 的 最 
坏 情况 下 的 复杂 度 。 用 合适 的 数据 测试 代码 的 正确 性 。 

开发 一 个 基于 线性 探查 的 散 列表 类 ， 要 求 用 neverUsed 思想 进行 删除 操作 。 为 每 个 方法 编 
写 C++ 代码。 其 中 有 一 个 方法 ， 它 在 60% 的 空 桶 的 neverUsed 域 的 值 为 false 时 ， 重 新 
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组 织 散 列表 。 重 新 组 织 散 列表 的 过 程 要 在 必要 时 移动 记录 ， 重 新 组 织 :之 后 每 个 空 桶 的 
neverUsed 域 的 值 为 true。 测 试 代 码 的 正确 性 。 
1 ) 实现 一 个 基于 二 次 探查 ( quadratic probing ) 的 散 列表 类 。 不 用 实现 删除 方法 。 从 本 书 
网 站 上 去 查看 二 次 探查 的 描述 。 
2 ) 把 你 的 类 和 10.5.3 节 的 hashTable 类 做 性 能 比较 。 用 实验 方法 测量 成 功 搜索 和 失败 搜索 
的 关键 字 平 均 比 较 次 数 ， 以 及 实际 运行 时 间 。 


.用 双重 散 列 法 ( double hashing ) 而 非 二 次 探查 法 来 做 练习 28。 从 本 书 网 站 查看 双重 散 列 


的 描述 。 


. 在 分 别 用 线性 探查 和 链 式 散 列 表 生 成 访问 序列 时 ， 都 各 有 什么 困难 ? 
. 在 链 式 散 列表 条 件 下 做 练习 17。 
. 在 链 式 散 列表 条 件 下 做 练习 20。 
3 


开发 新 类 sortedChainWithTail， 其 中 有 序 链 表 有 一 个 尾 节点 。 在 操作 开始 时 ， 把 要 搜索 、 
插入 或 删除 的 数 对 或 关键 字 放 入 尾 节 点 中 以 简化 代码 。 对 有 尾 节点 和 没有 尾 节 点 的 类 做 时 
间 性 能 比较 。 

从 头 开发 chainedHashTable 类 ， 实 现 dictionary 的 所 有 方法 。 不 使 用 任何 链表 类 的 方法 实 
现 插入 和 删除 。 测 试 代码 。 


. 设计 一 个 链 式 散 列 表 类 hashChainsWithTails， 其 中 的 链表 是 类 sortedChainWithTail ( 见 练 


习 33 ) 的 实例 。 比 较 hashChains 类 和 hashChainsWithTails 类 的 时 间 性 能 。 

设计 一 个 类 hashChainsWithTail， 其 中 每 个 散 列 链表 都 是 一 个 有 尾 节 点 的 有 序 链表 ， 而 且 
所 有 链表 在 物理 上 都 共享 一 个 尾 节点 。 不 使 用 任何 链表 类 的 方法 实现 插入 和 删除 。 和 类 
hashChains ( 见 程序 10-20 ) 比较 时 间 性 能 。 


.为 了 简化 链 式 散 列 的 插入 和 删除 操作 ， 可 以 在 每 个 链表 中 加 一 个 头 节点 。 现 在 ， 所 有 的 捅 


入 和 删除 都 在 头 尾 节点 之 间 进 行 。 以 前 在 链表 的 头 部 进行 插入 和 删除 的 情形 不 存在 了 。 
) 所 有 的 链表 是 和 否 能 使 用 同一 个 头 节点 ? 为 什么 ? 

2 ) 是 否 需 要 在 头 节 点 的 关键 字 域 设置 一 个 特定 的 值 ? 为 什么 ? 

3 ) 从 头 开 发 和 测试 一 个 类 hashChainsWithHeadersAndTail， 其 中 每 一 个 链表 都 有 一 个 头 节 
点 和 一 个 尾 节点 。 编 写 所 有 了 娟 数 的 代码 。 不 使 用 任何 链表 类 的 方法 实现 插入 和 删除 。 
包含 类 hashChains 的 所 有 方法 。 

4 ) 指出 下 列 三 种 链 式 散 列 的 优 缺 点 : 有 头 节 点 和 尾 节点 的 ; 只 有 尾 节点 的 ; 既 没 有 头 节 
点 也 没有 尾 节点 的 。 你 会 推荐 哪 一 种 ”为 什么 ? 


.1 ) 实现 一 个 散 列 表 类 ， 它 把 迭代 器 向 量 应 用 到 数 对 线性 表 。 数 对 线性 表 是 STL 类 list 的 


实例 。 所 有 起 始 桶 为 0 的 数 对 是 线性 表 的 首 元 素 。 在 迭代 器 向 量 中 的 第 i 个 迭代 器 指 
向 第 i 个 起 始 桶 链表 的 第 一 个 数 对 。 测 试 你 的 代码 。 

2 ) 与 10.5.4 节 的 类 hashChains 比较 性 能 ， 用 实验 方法 测量 成 功 搜索 和 失败 搜索 的 关键 字 
平均 比较 次 数 ， 以 及 实际 运行 时 间 。 

对 hashChains<K,E>::inert 做 练习 25。 

1 ) 设计 一 个 实验 ， 用 来 比较 sortedChain 、skipList、hashTable 、hashChains 和 hash _map 
的 时 间 性 能 。 因 为 本 书 没有 实现 hashTable<K,E>::erase， 所 以 只 需 对 find 和 insert 方 
法 进行 实验 。 

2 ) 实施 1 ) 的 实验 ， 测量 运行 时 间 。 用 表 和 条 形 图 显示 实验 结果 。 
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3 ) 你 建议 用 哪 一 个 类 实现 字典 算法 ? 
41. 为 链 式 散 列 表 推 导出 U, 和 5, 公式， 其 中 链表 无 序 。 持 入 的 节点 总 是 附加 在 链表 的 右 端 。 


10.6 一 个 应 用 一 一 文本 压缩 


为 了 减少 一 个 文本 文件 的 磁盘 空间 ， 常 常 需要 把 该 文本 文件 压缩 编码 后 存储 。 例 如 ， 一 
个 文本 文件 包含 两 个 字符 串 ， 一 个 是 由 1000 个 x 组 成 的 字符 串 ， 另 一 个 是 由 2000 个 y 组 成 
的 字符 串 ， 如 果 不 压 缩 存 储 ， 则 需要 3002 字 节 (x 和 y 各 占 1 字 节 ， 两 个 串 结束 符 占 2 字 
节 )。 如 果 用 游程 长 度 编码 ( run-length coding )， 把 它 存 储 为 字符 串 1000x2000y， 则 仅 为 10 
个 字母 长 ， 占 用 12 字 节 。 如 果 用 二 进 制 表示 游程 长 度 ( 1000 和 2000 )， 还 可 以 进一步 节约 空 
间 。 每 个 游程 长 度 占用 2 字 节 ， 最 大 游程 长 度 为 2 “。 这 样 一 来 ， 例 子 中 的 字符 串 只 需 用 8 字 
节 的 存储 空间 。 当 要 读 取 编码 文件 时 ， 需 要 将 其 解码 为 原始 文件 。 对 文件 进行 编码 的 是 压缩 
器 ( compressor )， 解 码 的 解压 器 ( decompressor )。 

本 节 采 用 由 Lempel、Ziv 和 Welch 所 开发 的 技术 ， 设 计 对 文本 文件 进行 压缩 和 解压 缩 的 
C++ 代码 。 这 种 技术 称 为 LZW 方法 。 


10.6.1 LZW 压缩 


LZW 压缩 方法 把 文本 字符 串 映射 为 数字 编码 。 首 先 ， 该 文本 串 中 所 有 可 能 出 现 的 字母 都 
被 分 配 一 个 代码 。 例 如 ， 要 压缩 的 文本 串 是 $=aaabbbbbbaabaaba， 它 由 字符 a 和 b 组 成 ,a 的 
代码 是 0，b 的 代码 是 1。 

字符 串 和 编码 的 映射 关系 存储 在 一 个 数 对 字典 中 ， 每 个 数 对 形 如 (key, value )， 其 中 key 
是 字符 串 ，value 是 该 字符 串 的 代码 。 本 例 的 初始 字典 如 图 10-5a 所 示 。 




















EE EE 
x [ab [ablaal La lb |aa|aab) 
[aaabbbbbbaabaaba alaabbbbbbaabaaba aaalbbbbbbaabaaba 
压缩 串 =unll 压缩 串 =0 压缩 串 王 02 
a) 初始 布局 b) a 被 压缩 c) aaa 被 压缩 
0 于 2 13 14 | olll21314ls) s | 
a | b | aa [aab| bb aa | ab] bb | bb a | b | aa [aab| bb [bob] boba] 
bbaabaab aaabbblbbbaabaaba aaabbbbbblaabaabal 
压缩 串 一 021 压缩 串 一 0214 压缩 串 =02145 
d) aaab 被 压缩 e) aaabbb 被 压缩 f aaabbbbbb 被 压缩 
[0"11|2|3|4|5| e617 
| a | b | aa [aab| bb [bbb| bbba | aaba| 
aaabbbbbbaablaabal 
压缩 串 一 021453 


g) aaabbbbbbab 被 压缩 
图 10-5 LZW 压缩 
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从 图 10-5a 的 初始 布局 开始 ，LZW 压缩 器 不 断 在 文本 串 5 的 未 编码 部 分 ( 阴影 部 分 ) 中 
寻找 与 字典 中 一 个 字符 串 相 匹配 的 最 长 的 字符 串 ， 并 输出 它 的 代码 。 这 个 字符 串 称 前 经， 用 
p 表示 。 所 谓 p 是 最 长 的 字符 串 ， 是 指 如 果 在 8 中 存在 下 一 个 字符 c， 则 需要 为 pc ( pc 是 前 
缀 p 加 字符 c ) 分 配 一 个 代码 ， 并 将 其 插入 字典 。 这 种 策略 称 为 LZW 规则 (LZW rule )。 

现在 我 们 用 LZW 方法 来 压缩 文本 串 89。 在 文本 串 (图 10-5a 的 阴影 部 分 ) 中 出 现 的 起 
始 字典 中 最 长 的 前 缀 为 a， 输 出 其 编码 0。 然 后 为 字符 串 aa ( 即 pce, p 是 a, c 是 a) 分 配 代 码 
2， 并 插入 字典 中 。 图 10-5b 是 现在 的 字典 和 8 的 布局 。 在 $ 余 下 的 字符 串 ( 阴影 部 分 ) 中 出 
现 的 字典 中 最 长 的 前 缀 为 aa， 输出 它 对 应 的 代码 2， 同 时 为 字符 串 aab 分 配 代 码 3， 并 插入 字 
典 中 ， 结 果 如 图 10-5c 所 示 。 注 意 ， 虽 然 为 aab 分 配 了 代码 3， 但 仅 输出 了 aa 的 代码 2， 这 是 
因为 在 读 到 字符 串 aa 时 ， 字 符 串 aab 还 不 是 字典 中 的 字符 串 ， 只 是 在 aa 按 代码 输出 后 ， 字 符 
串 aab 才 有 了 代码 ， 并 被 插入 字典 中 。 后 缓 b 将 作为 下 一 个 代码 的 组 成 部 分 。 编 码 表 不 是 压 
缩 文件 的 组 成 部 分 。 相 反 ， 在 解压 时 ， 只 要 严格 遵循 LZW 规则 ， 就 可 以 使 用 压缩 文件 重建 编 
码 表 。 

输出 代码 2 之 后 ， 输 出 b 的 代码 ， 为 bb 分 配 代码 4， 并 插入 字典 中 ( 见 图 10-5d )。 然 后 
输出 bb 的 代码 ， 为 bbb 分 配 代码 5， 并 插入 字典 中 ( 见 图 10-5e )。 输出 5， 并 为 bbba 分 配 代 
码 6， 然 后 插入 字典 中 ( 见 图 10-5f )。 接 下 来 输出 aab 的 代码 3， 同 时 为 aaba 分 配 代 码 7， 并 
插入 字典 中 ( 见 图 10-5g )。 结 果 文 本 串 5 的 编码 为 0214537。 


10.6.2 ”LZW 压缩 的 实现 


LZW 压缩 程序 包括 的 函数 有 : 打开 输入 和 输出 文件 (setFiles )、 输 出 压缩 文件 (output )、 
按 位 读 取 输入 文件 和 确定 输出 代码 (compress )、 主 函数 ( main )。 

1. 建立 输入 和 给 出 流 

给 压缩 器 的 输入 是 文本 文件 ,从 压缩 器 的 输出 是 二 进 制 文 件 。 如 果 输 入 文件 名 为 
inputFile， 则 输出 文件 名 为 inputFile.zzz。 进 一 步 假 定 ， 用 户 在 命令 行 中 输入 要 压缩 的 文件 名 。 
车 压缩 程序 为 compress， 则 命令 行为 


compress foo 


就 可 以 得 到 文件 foo 的 压缩 版 本 foo.zzz。 若 用 户 没有 输入 文件 名 就 应 提醒 用 户 输入 。 
函数 setFiles ( 见 程序 10-21 ) 创建 输入 输出 流 in 和 out， 它 们 分 别 是 ifstream 和 ostream。 
类 型 的 全 局 变量 。 假 定 函数 main 的 原型 为 : 


void main (int argc , char*argv[]) 

argc 的 值 是 命令 行 的 参数 个 数 ，argv[i] 为 指向 第 i 个 参数 的 指针 。 若 命令 行为 
compress foo 

则 argc 为 2，argv[0] 指向 字符 串 compress，argv[1] 指向 foo。 


程序 10-21 建立 输入 和 输出 流 
void setFiles(int argc char* argv[]) 
{/ 建立 输入 和 输出 流 
char outputFile[50], inputrFile{[54]; 
// 检查 是 否 有 文件 名 
if (argc >= 2) 
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strcpy (inputFile, argv[1]); 

else 

{// 没有 文件 名 ， 要 求 提供 文件 名 
cout << "Enter name of file to compress" << endl; 
cin >> inputFile; 

} 


1/ 打开 二 进 制 文件 
in.open (inputFile, ios::binary); 
if (in.fail()) 
{ 
cerr << "Cannot open " << inputFile << endl; 
exit {1); 
} 
strcpy (outputFile, inputFile); 
strcat (outputFile, "“.zz2"); 
out.open(outputFile, ios::binary); 
} 


2. 字典 组 织 

字典 的 每 个 数 对 都 形 如 ( key,value )， 其 中 key 是 一 个 字符 串 ，value 是 该 字符 串 对 应 的 
一 个 整数 代码 。 虽 然 key 可 以 是 很 长 的 字符 串 , 但 是 我 们 可 以 把 它 压缩 为 固定 长 度 的 串 。 注 
意 ， 每 一 个 长 度 为 户 1 的 字符 串 key 都 有 这 样 的 性 质 ， 它 前 面 的 /-1 个 字符 ( 称 为 key 的 前 
缀 ) 是 字典 中 男 一 个 key， 而 每 一 个 字典 数 对 的 代码 是 唯一 的 (字符 串 也 是 唯一 的 )， 因 此 可 
以 用 代码 代替 前 级 。 在 图 10-5 的 例子 中 ， 关 键 字 aa 可 以 表示 为 0a，aaba 可 以 表示 为 3a。 现 
在 的 字典 形式 如 图 10-6 所 示 。 





图 10-6 ”aaabbbbbbaabaaba 修改 后 的 LZW 压缩 字典 


为 了 简化 压缩 文件 的 解码 ， 每 个 代码 的 位 数 一 样 ， 而 且 假定 都 是 12 位 长 。 因 此 最 多 分 配 
22=4096 个 代码 。 基 于 这 个 假定 ， 文 本 串 5 的 编码 0214537 需要 12*7=84 位 ， 大 约 11 字 节 。 

因为 每 个 字符 占 8 位 (假定 每 个 字符 都 属于 256 个 ASCII 字符 )， 所 以 一 个 关键 字 key 是 
20 位 长 (12 位 用 来 表示 前 级 ，8 位 用 来 表示 最 后 一 个 字符 )， 而 且 可 以 用 长 整数 (32 位 ) 来 
表示 。 字 典 本 身 可 以 表示 为 链 式 散 列表 。 若 素数 DIVISOR=4099 用 作 散 列 函数 的 除数 ， 则 装 
载 密度 就 会 小 于 1， 因 为 字典 最 多 有 4096 个 记录 。 声 明 


hashChains<long, int>h (DIVISOR) 

足以 用 来 建立 字典 表 。 

3. 代码 输出 

因为 每 个 代码 是 12 位 ， 每 个 字 节 是 8 位 ， 所 以 输出 的 只 能 是 代码 的 一 部 分 ， 即 一 个 字 
节 。 先 输出 代码 的 前 8 位 ， 余 下 的 4 位 留待 其 后 输出 。 当 要 输出 下 一 个 代码 时 ， 加 上 前 面 余 
下 的 4 位 , 共 16 人 位， 可 以 作为 2 字 节 输出 。 程 序 10-22 是 输出 函数 的 C++ 代码 。MASKI1 
为 235，MASK2 为 15，EXCESS 为 4，BYTE SIZE 为 8。 当 且 仅 当 有 余 位 待 输出 时 ， 
bitsLeftOver 是 true。 此 时 ， 余 下 的 4 位 放 在 变量 leftOver 中 。 
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程序 10-22 ”代码 输出 


void output (long pcode) 
{// 输出 8 位 ,把 剩余 位 保存 
int Sy di 
if (bitsLeftOver) 
{// 前 面 剩余 的 位 
d = int(pcode & MASK1); 1// 右 ByteSize 位 
c= int((leftOver << EXCESS) | (pcode >> BYTE SIZE)); 
SUts puti(e) 
But BUt(GY: 
bitsLeftOver = false; 
} 


else 
{W/ 前 面 没 有 剩余 的 位 
leftOver = pcode & MASK2; 1/ 右 EXCESS 位 


c= intl(pcode >> EXCESS); 
out .puti(e)s 
bitsLeftOver = true; 


4. 压缩 

程序 10-23 是 LZW 压缩 算法 的 代码 。 首 先 用 256 个 (ALPHA=256 ) 8 位 ASCI 字符 和 
它们 的 代码 对 字典 初始 化 。 变 量 codeUsed 记录 目前 已 用 的 代码 个 数 。 因 为 每 个 代码 为 12 位 ， 
则 最 多 可 分 配 MAX_CODES=4096 个 代码 。 为 了 在 字典 中 寻找 最 长 的 前 级 ， 我 们 按 前 缀 的 长 
度 1,2,3… 的 顺序 查找 ， 直 到 发 现 一 个 前 缀 在 字典 中 不 存在 为 止 。 这 时 就 输出 一 个 代码 ， 并 生 
成 一 个 新 代码 ( 除非 4096 个 代码 全 部 用 完 )。 


程序 10-23 ”LZW 压缩 器 


void compress () 
{// -2-W 压缩 器 
1/ 定义 和 初始 化 代码 字典 
hashChains<long, int> h (DIVISOR); 
for (inNt 1 0 i < BLPEHAS 1++} 
h.insert (pairType (i, i)); 
int codesUsed = ALPHA; 


/输入 和 压缩 
int c = in.get(); // 输入 文件 的 第 一 个 字符 
if (G !=s EOF) 
{/ 输入 文件 不 空 
long pcode = c; /1/ 前缀 代码 
while ((c = in.get()) != EOF) 
{1/ 处 理 字符 c 
long theKey = (pcode << BYTE SI2E) + cy; 
// 检查 关键 字 theKey 的 代码 是 否 在 字典 中 
pairType* thePair = h.find(theKey) 
if (thePair == NULL) 
{/ 关键 字 theKey 不 在 表 中 
output (pcode); 
if (codesUsed < MAX CODES) /建立 新 代码 
h.insert (pairType ((pcode << BYTE SIZE) | ¢, codesUsed++)); 
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pcode = c; 


} 
else pcode = thePair->second; // 关键 字 theKey 在 表 中 


} 
1/ 输出 最 后 的 代码 
output (pcode); 
if (bitsLeftOver) 
out .put (leftOver << EXCESS); 
} 


out.close(); 


in.close(); 


} 


5. 常量 、 全 局 变量 和 main 函数 
程序 10-24 给 出 了 常量 、 全 局 变量 和 main 函数 。 


程序 10-24 ”常量 、 全 局 变量 和 main 函数 


1/ 常量 

const DIVISOR = 4099, 1// 散 列 函 数 的 除数 
MAX_CODES = 4096, /2^12 
BYTE SIZE = 8， 
EXCESS = 4， /12 - BYTE SIZE 
RALPHR = 256, /1/2^BYTE SIZE 
MASK1 = 255, I/ALPHA - 1 
MASK2 = 15; // 2^EXCESS - 1 


typedef pair<const long, int> pairType }; 


Mpair.first = key, pair.second = code 
/全 局 变量 
int leftOver; // 待 输出 的 代码 位 
bool bitsLeftOver = false; /false 表示 没有 余下 的 位 
ifstream in; // 输入 文件 
ofstream out; // 输出 文件 


void main(int argc, char* argv[]) 
{ 
setFiles(argc, argv); 
compress (); 


10.6.3 ”LZW 解压 缩 


解压 时 ， 每 次 输入 一 个 代码 ， 然 后 把 代码 蔡 换 为 相应 的 文本 。 从 代码 到 文本 的 映射 可 按 
下 面 的 方法 重新 构造 。 把 分 配给 单一 字符 文本 的 代码 插 和 人 字典 中 。 像 前 面 一 样 ， 字 典 记录 的 
形式 为 代码 - 文本。 然而 此 时 是 根据 给 定 的 代码 去 查找 字典 记录 ( 而 不 是 根据 文本 )。 因 此 ， 
在 形 如 (key，value ) 的 字典 记录 中 ，key 是 代码 ，value 是 代码 表示 的 文本 。 压 缩 文件 中 的 
第 一 个 代码 对 应 于 一 个 单一 的 字母 ， 然 后 可 以 替换 为 该 字母 。 对 于 压缩 文件 中 的 其 他 代码 p， 
要 考虑 到 两 种 情况 : 1 ) 代码 p 在 字典 中 ; 2 ) 代码 p 不 在 字典 中 。 
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1. 代码 p 在 字典 中 的 情形 

当 p 在 字典 中 时 ， 找 到 与 p 对 应 的 文本 text(p) 输出 。 由 压缩 器 原理 可 知 ， 如 在 压缩 文 
件 中 ， 代 码 q 出 现在 p 之 前 ， 且 text(q) 是 q 对 应 的 文本 ， 则 压缩 器 会 为 文本 text(q) 和 文本 
text(p) 的 第 一 个 字符 fc(p) 所 连接 构成 的 文本 text(q)fe(p) 分 配 一 个 新 代码 。 于 是 在 字典 中 插入 
数 对 (下 一 个 代码 ，text(q)fc(p) )。 

2. 代码 p 不 在 字典 中 的 情形 

只 有 在 文本 段 中 的 形式 为 text(q)text(q)fc(q) 和 text(p)=text(q)fc(q)， 且 相应 的 压缩 文件 段 
为 qp (其 中 9q 是 文本 text(q) 的 代码 ，p 是 文本 text(q)fe(q) 的 代码 ) 的 时 候 ， 在 qp 的 解压 缩 
过 程 中 ， 当 q 被 text(q) 代替 之 后 ， 代 码 p 在 字典 中 才 不 会 有 对 应 的 文本 ， 而 这 个 文本 应 该 是 
text(q)fc(q)， 其 中 q 是 在 p 前 的 代码 。 

3. 一 个 例子 

让 我 们 用 这 个 解码 策略 来 解压 前 面 的 字符 串 

aaabbbbbbaabaaba 

这 个 串 被 压缩 为 代码 0214537。 首 先 用 (0,a) 和 (1,b) 来 初始 化 字典 ， 使 字典 具有 了 前 两 个 数 
对 ， 如 图 10-5 所 示 。 压 缩 文 件 的 第 一 个 代码 为 0， 则 用 文本 a 代替 。 下 一 个 代码 2 未 定义 ， 
它 前 面 的 代码 为 0， 且 text(0)=a，fc(0)=a， 因 此 text(2)=text(O)fc(0)=aa。 用 aa 代替 2， 并 把 
(2,aa) 插入 字典 。 下 一 个 代码 1 由 text(1)=b 来 代替 ， 并 把 (3,text(2)fc(1))=(3,aab) 插入 字典 。 
下 一 代码 4 不 在 字典 中 ， 它 前 面 的 代码 为 1， 因 此 text(4)=text(1)fe(1)=bb。 把 (4,bb) 插入 字 
典 , 日 将 bb 输出 到 解压 文件 。 下 一 个 代码 是 5，(5,bbb) 被 插入 字典 ， 同 时 把 bbb 输出 到 解 
压 文 件 。 下 一 代码 为 3，text(3)=aab， 于 是 把 aab 输出 到 解压 文件 ， 并 将 数 对 (6,text(5)fc(3))= 
(6,bbba) 插入 字典 。 最 后 遇 到 代码 7， 把 (7,text(3)fe(3))=(7,aaba) 插入 字典 中 ， 并 输出 aaba。 


10.6.4 LZW 解压 缩 的 实现 


与 压缩 算法 的 实现 一 样 ， 解 压缩 的 实现 也 要 分 几 个 子 任务 ， 每 一 个 子 任务 都 由 一 个 函数 
来 实现 。 因 为 解压 缩 函 数 setFiles 与 相应 的 压缩 函数 相 比 ， 功 能 非常 相似 ， 因 此 就 不 讨论 了 。 

1. 字典 组 织 

因为 在 解压 缩 过 程 中 ， 我 们 是 根据 代码 来 查询 字典 ， 而 且 代码 总 数 为 4096， 所 以 我 们 可 
以 用 数组 ht[4096]， 把 text(p) 储存 在 ht[p] 中 。 使 用 数组 ht 的 方式 就 像 理想 散 列 ， 散 列 函 数 
f(A)=k。 同 时 像 图 10-6 那样 ， 把 text(p) 压缩 存储 为 其 前 组 代码 和 最 后 一 个 字符 ( 后 级 )。 在 
解压 缩 过 程 中 ， 用 两 个 域 来 分 别 存储 前 缀 代码 和 后 级 是 很 方便 的 。 前 缀 代码 存储 的 第 一 个 域 ， 
后 组 存储 在 第 二 个 域 。 声 明 为 


typedef pair<int, char>pairType; 
pairType ht[IMAX CODES]; 


可 以 用 来 定义 字典 。 于 是 ， 如 果 text(p)=text(qjc， 那 么 ht[p].second 为 字符 c, ht[p].first 等 于 q。 

采用 这 种 字典 组 织 方式 ， 可 从 最 后 一 个 字符 ht[p].second 开始 ， 按 从 右 到 左 的 次 序 ， 建 构 
text(q)， 如 程序 10-25 所 示 。 当 代码 三 ALPHA 时 ， 从 表 ht 中 得 到 后 缀 ; 当代 码 < ALPHA 时 ， 
代码 就 是 相应 字符 的 整数 表示 。text(p) 被 收集 到 字符 数组 s[ ] 中 ， 然 后 输出 。 因 为 text(p) 是 
从 右 到 左 收集 储存 的 ， 所 以 text(p) 的 第 一 个 字符 存储 在 s[size] 中 。 
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程序 10-25 ”计算 text(code) 
void output (int code) 
{1/ 输出 与 代码 code 对 应 的 串 
size = -1;} 
while (code >= ALPHA) 
{// 字典 中 的 后 组 
s[++size] = ht[codel] .second; 
code = htl[lcode] .first; 
] 
s[++size] = code; /l/code < ALPHA 


1/ 解压 的 串 是 s[size] … s[0] 
for (i 4 一 Sizes td 2= 0 A=-=) 
GUtaBut (SS[i] 小: 





} 





2. 代码 输入 


由 于 12 位 代码 在 压缩 文件 中 是 按 8 位 字 节 顺序 表示 的 ， 所 以 要 把 LZW 压缩 器 的 函数 
output( 见 程 序 10-22 ) 的 处 理 过 程 颠 倒 过 来 。 这 个 颠倒 过 程 由 getCode 函数 ( 见 程序 10-26 ) 
来 完成 。 此 处 唯一 的 新 常量 是 MASK， 其 值 为 13， 它 可 以 帮助 我 们 提取 一 个 字 节 的 低 4 位。 


程序 10-26 ”从 压缩 文件 中 提取 代码 
bool getCode (int& code) 
{// 把 压缩 文件 中 的 下 一 个 代码 存 入 code 
// 如 果 不 再 有 代码 ， 返 回 false 
二 站 七 Gs Qs 
if ((c = in.get()) == EOF) 
return false; /不 再 有 代码 








// 检查 前 面 是 否 有 剩余 的 位 
1// 如 果 有 ， 与 其 连接 
if (bitsLeftOver) 

code = (leéftOver << BYTE SIZE) | G7 
else 
{// 没有 剩余 的 位 ， 需 要 再 加 4 位 以 凑 足 代码 
qd = in.get(); /另外 8 位 








code = (C << EXCESS) | (da >> EXCESS) ， 
leftOver = d & MASK; /存储 4 位 
} 

bitsLeftOver = !IbitsLeftOver; 


return true; 
} 


3. 解压 缩 

程序 10-27 是 LZW 解压 器 。 压 缩 文件 的 第 一 个 代码 在 while 循环 体外 人 解码， 方法 是 用 一 
个 类 型 转换 ， 而 其 他 代码 则 在 循环 体内 解码 。 在 while 循环 的 每 一 次 迭代 开始 时 ， 在 s[size] 
中 存 有 上 次 输出 的 解码 文本 的 第 一 个 字符 。 为 了 使 第 一 个 循环 也 满足 此 条 件 ， 可 以 把 size 置 
为 0 且 把 s[0] 置 为 压缩 文件 中 第 一 个 代码 所 对 应 的 唯一 的 一 个 字符 。 


程序 10-27 LZW 解码 器 





void decompress () 


{// 解压 一 个 压缩 文件 
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int codesUsed = ALPHA; // 当前 代码 codeUsed 
1// 输入 和 解压 缩 
int pcode, / 前 面 的 代码 
ccode; // 当前 的 代码 
if (getCode (pcode)) 
{W/ 文 件 不 空 
s[0] = pcode; 1/ 取 pcode 的 代码 
out.put (s[0]); 1// 输 出 pcode 的 串 
size = 0; 1//s[lsize] 是 最 后 一 个 输出 囊 的 第 一 个 字符 


while (getCode (ccode)) 
{W/ 又 一 个 代码 
if (ccode < codesUsed) 
{// 确定 ccode 
output (ccode); 
if (codesUsed < MAX_CODES) 
{/ 建立 新 代码 
ht [codesUsed] .first = pcode; 
ht[codesUsed++] .second = s[size]; 
} 
} 
else 
{1/ 特殊 情况 ,没有 定义 的 代码 
ht[codesUsed] .first = pcode; 
hticodesUsed++] .second = sl[sizel]; 
output (ccode); 
} 


pcode = ccode; 
} 
out.close (); 


in.close(); 


} 





while 循环 体 不 停 地 从 压缩 文件 中 取得 代码 ccode 并 对 其 解码 。 代 码 ccode 可 能 有 以 下 两 
种 情况 : 1 ) 在 字典 中 ; 2 ) 不 在 字典 中 。 当 且 仅 当 ccode<codesUsed 时 ，ccode 在 字典 中 ， 其 
中 ht[0 : codesUsed-1] 是 ht 表 中 已 定义 部 分 。 在 这 种 情况 下 ， 用 解压 缩 函 数 output 和 LZW 
规则 来 解码 ， 产 生 一 个 新 代码 ， 其 后 级 是 刚 输 出 的 与 ccode 相对 应 的 文本 的 第 一 个 字母 。 当 
ccode 没有 定义 时 ， 即 本 节 开 始 所 讨论 的 情况 ，ccode 对 应 的 文本 是 text(pcode)s[size]。 可 根据 
此 信息 为 code 创建 一 个 新 码 表 ， 然 后 输出 与 其 相对 应 的 解码 后 的 文本 。 

4. 常 量 、 全 局 变量 和 main 函数 

程序 10-28 是 LZW 解压 缩 程序 所 包含 的 常量 、 全 局 变量 和 main 函数 。 


程序 10-28 解压 缩 程 序 所 包含 的 常量 、 全 局 变量 和 main 函数 


1/ 常量 

const MAX CODES = 4096, ”包工 
BYTE_SIZE = 8 
EXCESS = 4， /12 - BYTE SIZE 
ALPHA = 256, //2^BYTE SIZE 


MASK = 15; NH2*EXCESS = 1 


务 二 部分 洲 据 络 蒋 


typedef pair<int, char> pairType; 


// 全 局 变量 

pairType ht[MAX_CODES]: // 字典 

char s[MAX CODES]; 1/ 用 来 重建 文本 

int size; // 重建 文本 的 大 小 

int leftOver; / 待 输出 的 代码 位 

bool bitsLeftOver = false; 1/ false 表示 没有 剩余 位 
ifstream in; // 输入 文件 

ofstream out; 1// 输出 文件 


void main(int argc, char* argv[]) 
4 
setFiles(argc, argv); 
decompress (); 


} 


10.6.5 ”性 能 评价 


与 常用 的 压缩 程序 zip 相 比 ， 我 们 的 压缩 器 有 什么 优点 呢 ?7 压缩 程序 把 33 772 字 节 的 
ASCI 文件 压缩 为 18 765 字 贡 0 33 772/18 765=1.8 ; 而 zip 做 得 更 好 ， 它 把 同样 的 
文件 压缩 为 11 041 字 节 ， 抽风 本 为 3.1。 但 是 我 们 不 在 乎 与 zip 的 性 能 差距 ， 毕 竟 像 zip 这 样 
tee Feb vin eto deeds pgp 
提高 了 压缩 率 ， 而 我 们 是 LZW 压缩 器 的 源码 ， 不 能 在 性 能 方面 与 一 个 商业 压缩 器 比较 。 


练习 


42. 假设 一 个 LZW 压缩 字典 有 两 个 记录 (a,0) 和 (b,1)。 
1 ) 对 字符 串 babababbabba， 模 仿 图 10-5， 画 出 每 一 个 字符 处 理 后 的 LZW 压缩 字典 。 
2 ) 对 字符 串 babababbabba 的 压缩 形式 给 出 代码 序列 。 
3 ) 对 2 ) 的 代码 序列 进行 解压 缩 。 对 每 一 个 代码 ， 说 明 如 何 解码 。 画 出 每 一 个 代码 解码 

后 的 解码 表 。 

43. 对 长 度 为 10 的 字符 串 A(10)=aaaaaaaaaa， 做 练习 42。 开 始 时 字典 只 有 一 个 数 对 (a,0)。 对 
长 度 为 100 且 全 部 由 a 组 成 的 字符 串 A(100)， 你 能 预测 代码 序列 吗 ? 

44. LZW 压缩 器 代码 使 用 的 是 类 hashChains。 如 果 把 它 改 为 类 sortedChain 、hashTable 和 
hash_map， 效 果 如 何 ? 对 同一 个 输入 文件 comtress.input 进行 压缩 时 ,测量 它们 的 运行 
时 间 ， 该 文件 可 以 在 本 书 网 站 上 得 到 。 基 于 实验 结果 ， 你 建议 使 用 哪 一 个 散 列 表 类 ? 为 


什么 ? 
45. 用 LZW 压缩 器 产生 的 压缩 文件 是 否 可 能 比 床 交 作 长 呢 ? ed 长 多 少 ? 
46. 一 个 文件 只 包含 字符 fab…,z0,1 9 ”} 和 换行 符 ， 为 这 样 的 文件 


编写 一 个 LZW 压缩 器 和 解压 器 。 每 个 代码 8 位 ， 试 测 试 程序 的 正确 性 。 压缩 文件 是 否 可 
能 比 原文 件 长 ? 

47. 重新 修改 LZW 压缩 和 解压 缩 程序 ， 每 当 压 缩 /解压 缩 1024x 个 字 节 后 ， 重 新 初始 化 代码 
表 。 用 修改 后 的 压缩 程序 做 实验 ， 使 用 的 文本 文件 长 为 100K ~ 200K，x=10,20,30,40 和 
50。x 取 什么 值 ， 压 缩 效 果 最 好 ? 
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48. 一 个 索引 表 ( concordance ) 是 一 个 按 字母 顺序 排列 的 文本 的 单词 表 。 它 的 每 一 项 都 是 一 个 
数 对 ， 形 如 (单词 ， 按 序 排列 的 含有 该 单词 的 行 号 )。 注 意 ， 索 引 表 和 书 的 目录 类 似 ， 但 
不 完全 一 样 。 一 本 书 的 索引 列 出 的 是 书 的 一 部 分 内 容 所 在 的 页 码 。 而 一 个 索引 包含 每 一 个 
单词 ， 而 且 列 出 的 是 行 号 而 不 是 页 码 。 练 习 的 目的 是 编写 一 个 程序 ， 它 用 散 列 表 创 建 索 引 
表 。 散 列表 的 每 一 项 是 一 个 数 对 ( key, list ) = ( 词汇 ， 含 有 该 词汇 的 行 号 有 序 表 )。 

1 ) 为 散 列 表 的 对 数 开发 一 个 C++ 类。 为 key 和 list 选择 合适 的 类 型 。 在 为 list 选择 数据 
类 型 时 ， 可 以 考虑 类 型 vector 、arrayList、chain 、arrayQueue 、linkedQueue 和 任何 可 
用 的 用 户 类 型 。 

2 ) 编写 两 个 C++ 程序， 输入 文本 和 输出 它 的 索引 表 。 第 一 个 程序 应 该 使 用 STL 的 类 
hash_map 去 构建 索引 项 ， 然 后 是 一 个 排序 方法 按 关键 字 给 索引 项 排序 。 第 二 个 程序 应 
该 使 用 类 hashChains 去 构建 索引 项 ， 然 后 合并 散 列 链表 ， 以 获得 索引 项 的 有 序 表 。 

3 ) 比较 两 个 程序 的 时 间 性 能 。 


10.7 参考 及 推荐 读物 


跳 表 是 由 William Pugh 提出 的 。 其 平均 复杂 度 的 分 析 见 论文 W. Pugh. Skip lists: 4 
Probabilistic Alternative to Balanced Trees. Communications of the ACM, 33, 6, 1990, 668~676。 

访问 本 书 网 站 ， 了 解 更 多 的 关于 散 列 函 数 和 溢出 处 理 的 机 制 。 要 详细 了 解散 列 的 知识 ， 
可 以 看 书 D. Knuth. The Art of Computer Programming: Sorting and Searching, Volume 3. 2nd ed. 
Addison-Wesley, Menlo Park, CA, 1998. 

关于 LZW 压缩 办 法 的 描述 基于 T.Welch 的 论文 ，T. Welch. 4 Technique for High-Performance 
Data Compression. IEEE Computer, 1994, 8-19. 要 想得到 更 多 的 有 关 压 缩 数据 的 知识 ,参见 D. 
Lelewer, D. Hirschberg. Data Compression. ACM computing Surveys, 19, 3, 1987, 261~296. 
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二 叉 树 和 其 他 树 





概述 


是 的 ， 那 是 一 片 丛林。 从 林 中 有 各 种 各 样 的 树 、 植 物 和 动物 。 数 据 结构 的 世界 也 有 许 
多 “ 树 "， 不 过 本 书 不 可 能 全 部 介绍 。 本 章 将 研究 两 种 基本 的 树 : 一 般 树 ( 简单 树 ) 和 二 又 
树 。 第 12 ~ 15 章 将 研究 更 多 的 大 家 熟悉 的 树 一 一 堆 ( heap )、 左 高 树 ( leftist tree )、 锦 标 赛 
树 (tournament tree )、 二 又 搜索 树 (binary tree )、AVL 树 、 红 黑 树 ( red-black tree )、 伸 展 树 
(splay tree ) 和 B 树 。 第 12 ~ 14 章 比较 独立 ， 可 以 按 任意 顺序 阅读 。 而 第 15 章 只 有 在 消化 
了 第 14 章 之 后 才能 阅读 。 如 果 学 完 这 几 章 之 后 ， 你 还 渴望 学 习 另 外 一 些 树 结 构 一 一 配对 堆 
( pairing heap )、 区 间 堆 (interval heap )、 双 端 优 先 级 队列 的 树 结构 ( tree structures for double- 
ended priority queue )、 字 典 树 (tries， 也 称 前 缓 树 、 单 词 查找 树 、 键 树 )、 后 缀 树 ( suffix 
tree )， 你 可 以 从 本 书 网 站 上 得 到 相关 的 内 容 。 

本 章 的 应 用 部 分 有 两 个 树 的 应 用 。 第 一 个 应 用 是 关于 在 一 个 树 形 分 布 的 网 络 中 设置 信和 号 
调节 器 。 第 二 个 应 用 是 再 讨论 6.5.4 节 的 在 线 等 价 类 问题 。 这 个 问题 在 本 章 中 又 被 称 为 合并 / 
搜索 问题 。 利 用 树 来 解决 等 价 类 问题 要 比 6.5.4 节 的 链表 解决 方案 高 效 得 多 。 

另外 ， 本 章 中 还 涵盖 了 以 下 内 容 : 

e 树 和 二 叉 树 的 术语 ， 如 高 度 、 深 度 、 层 、 根 、 叶 子 、 孩 子 、 双 亲 和 兄 弟 。 

e 二 义 树 的 数组 和 链表 表示 。 

e 4 种 常用 的 二 又 树 遍历 方法 : 前 序 遍 历 、 中 序 遍 历 、 后 序 遍 历 和 层次 遍历 。 


11.1 树 


到 目前 为 止 ， 我 们 已 经 介绍 了 线性 数据 结构 和 表 数 据 结构 。 这 些 数据 结构 一 般 都 不 适合 
于 表示 具有 层次 结构 的 数据 。 在 层次 化 的 数据 元 素 之 间 有 祖先 -后 代 、 上 级 - 下属、 整体 - 
部 分 以 及 其 他 类 似 的 关系 。 js 


例 11-1[Joe 的 后 代 ] 图 11-1 是 按 层 a 
次 组 织 起 来 的 Joe 和 他 的 后 代 ， 其 中 Joe 








i 中 靖 Ann Mary John 
处 在 最 顶层。Joe 的 孩子 (Ann、Mary 和 

John ) 列 在 下 一 层 ， 有 一 条 边 把 Joe 和 他 2 a 
的 孩子 连 在 一 起 。Ann 没有 孩子 ， 而 Mary 图 11-1 Joe 的 局 代 


有 两 个 孩子 ，John 有 一 个 孩子 。Mary 的 孩 

子 列 在 Mary 的 下 面 ，John 的 孩子 列 在 John 的 下 面 。 在 父母 和 孩子 之 间 有 一 条 边 。 从 层次 结 

构 的 表示 中 ， 很 容易 找到 Ann 的 兄弟 姐妹 、Joe 的 后 代 、Chris 的 祖先 ， 等 等 。 是 
例 11-2[ 公司 组 织 机 构 ] 图 11-2 是 一 个 公司 的 管理 机 构 ， 这 是 一 个 层次 结构 的 例子 。 

在 机 构 中 地 位 最 高 的 人 (此 处 为 总 裁 ) 处 在 图 的 顶层 。 地 位 次 之 的 人 ( 即 副 总 裁 ) 处 在 总 裁 
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之 下 ， 等 等 。 副 总 裁 是 总 裁 的 下 级 ， 总 裁 是 他 们 的 上 级 。 接 下 去 ， 每 个 副 总 裁 都 有 他 自己 的 
下 级 ， 这 些 下 级 可 能 也 有 他 们 自己 的 下 级 。 在 图 中 ， 每 个 人 与 其 直接 下 级 或 上 级 之 间 都 有 一 
条 边 。 


总 裁 
销售 副 总 裁 营销 副 总 裁 a 财务 副 总 裁 研发 副 总 裁 
图 11-2 一 个 公司 的 层次 管理 机 构 男 


例 11-3[ 政府 机 构 ] 图 11-3 是 联邦 政府 各 分 支 机 构 的 层次 图 。 在 最 项 层 的 是 整个 联邦 政 
府 。 第 二 层 是 主要 的 部 门 ， 例 如 各 个 部 。 每 个 部 可 进一步 细 分 。 例 如 ， 国 防 部 分 为 陆军 、 海 
军 、 空 军 和 海军 陆 战 队 。 在 每 个 机 构 及 其 分 支 机 构 间 都 有 一 条 边 。 图 11-3 的 数据 是 整体 -部 
分 关系 的 例子 。 


联邦 政府 
国防 部 教育 部 a 税务 部 


图 11-3 联邦 政府 模型 而 


例 11-4[ 软件 工程 ] 考察 男 一 种 层次 数据 一 一 软件 工程 的 模块 化 技术 。 模 块 化 的 思想 是 
把 大 而 复杂 的 项 目 分 成 一 组 小 而 简单 的 任务 。 模 块 化 的 目标 是 把 软件 系统 分 成 很 多 功能 独立 
的 部 分 或 模块 ， 使 每 个 模块 可 以 相对 独立 地 开发 。 因 为 解决 若干 个 小 问题 比 解决 一 个 大 问题 
更 容易 ， 所 以 模块 化 方法 可 以 缩短 整个 软件 开发 的 时 间 。 另 外 ,不同 的 程序 员 可 以 同时 开发 
不 同 的 模块 。 如 果 有 必要 ， 每 个 模块 可 以 再 细 分 ， 于 是 我 们 得 到 图 11-4 用 树 表示 的 模块 层次 
结构 。 它 是 一 个 文本 处 理 器 的 模块 分 解 图 。 


| ”文本 处 理 器 | 











文件 字体 ”| … [导入 




















11-4 文本 处 理 器 的 模块 层次 结构 


在 最 顶层 的 文本 处 理 器 被 划分 为 若干 个 模块 ， 在 图 11-4 中 只 有 4 个。 文件 模块 ( Files ) 
要 完成 的 功能 与 文本 文件 操作 有 关 ， 如 打开 一 个 已 存在 文件 (Open )， 打 开 一 个 新 文件 
(New )， 保 存 一 个 文件 (Save )， 打 印 一 个 文件 ( Print )， 从 文本 处 理 器 中 退出 〈Qnauit ) ( 如 果 
需要 ， 在 退出 时 要 保存 文件 )。 第 三 层次 的 每 一 个 模块 分 别 代表 一 个 函数 。 字 体 模块 ( Fonts ) 
要 实现 的 功能 与 字体 有 关 ， 如 改变 字体 、 大 小 、 颜 色 等 ， 若 把 这 些 功 能 模块 画 在 图 上 ， 它 们 
一 定 在 字体 模块 下 面 。 导 和 模块 (Import ) 的 功能 有 图 形 、 表 格 以 及 其 他 格式 的 文本 输入 。 
光标 模块 ( Cursor ) 处 理 屏 幕 上 光标 的 移动 ， 它 的 子 模块 都 与 光标 的 移动 有 关 。 在 接口 完全 
设计 好 之 后 ， 程 序 员 就 可 以 相对 独立 地 分 析 、 设 计 和 开发 每 个 模块 。 

当 一 个 软件 系统 以 模块 化 方式 说 明和 设计 好 之 后 ， 就 会 自然 地 以 模块 为 单位 来 开发 。 这 
时 ， 软 件 系统 的 模块 数 与 模块 层次 结构 的 节点 数 一 样 多 。 模 块 化 提高 了 对 问题 处 理 的 智能 化 
管理 水 平 。 把 一 个 大 问题 系统 地 分 解 成 规模 小 而 又 相对 独立 的 问题 ， 可 以 使 大 问题 的 处 理 更 
省 力 。 这 些 独立 的 小 问题 可 以 分 配给 不 同 的 人 同时 和 解决。 而 对 一 个 单一 模块 上 的 大 问题 就 不 
容易 分 工 处理 了 。 开 发 模块 化 软件 的 另 一 好 处 是 ， 分 开 测试 一 些小 而 独立 的 模块 比 测试 一 个 
大 的 模块 要 容易 得 多 。 层 次 结构 清晰 地 给 出 了 模块 间 的 关系 。 国 

定义 11-1 一 棵 树 ! 是 一 个 非 空 的 有 限 元 素 的 集合 ， 其 中 一 个 元 素 为 根 (root )， 其 余 的 
元 素 ( 如 果 有 的 话 ) 组 成 1 的 子 树 (subtree )。 

现在 来 看 这 个 定义 与 层次 数据 的 例子 之 间 有 什么 联系 。 在 层次 数据 中 最 高 层 的 元 素 是 根 。 
其 直接 下 一 级 元 素 是 子 树 的 根 。 

例 11-5 在 Joe 的 后 代 例 子 中 ( 见 例 11-1)， 数 据 集合 是 {Joe，Ann, Mary, Mark,， 
Sue, John，Chris}。 因 此 n=7。 集 合 的 根 是 Joe。 余 下 的 元 素 被 分 成 三 个 不 相交 的 集合 {Ann}， 
{Mary，Mark，Sue} 和 {John，Chris}。{Ann} 是 只 有 一 个 元 素 的 树 ， 其 根 为 Ann。{Mary， 
Mark，Sue} 的 根 为 Mary，{John，Chris} 的 根 为 John。 集 合 {Mary，Mark，Sue} 的 剩余 元 素 
分 成 不 相交 的 集合 {Mark} 和 {Sue}， 二 者 均 为 单元 素 的 子 树 ， 集 合 {John，Chris} 的 剩余 元 
素 也 为 单元 素 子 树 。 加 

在 画 一 棵 树 时 ， 每 个 元 素 都 代表 一 个 节点 。 树 根 画 在 上 面 ， 其 子 树 画 在 下 面 。 在 根 与 子 
树 的 根 ( 如 果 有 子 树 ) 之 间 有 一 条 边 。 同 样 的 ， 每 一 棵 子 树 也 是 根 在 上 ， 其 子 树 在 下 。 在 一 
棵 树 中 ， 一 个 元 素 节 点 及 其 孩子 节点 之 间 用 边 连 接 。 例 如 在 图 11-1 中 ，Ann、Mary 、John 是 
Joe 的 孩子 ( children )，Joe 是 他 们 的 父母 (parent )。 有 相同 父母 的 孩子 为 兄弟 (sibling )。 在 
图 11-1 中 ，Ann、Mary、John 是 兄弟 ， 而 Mark 和 Chris 不 是 兄弟 。 此 外 还 有 其 他 术语 : 孙子 
( grandchild )、 祖 父 ( grandparent )、 祖 先 ( ancestor )、 后 代 ( descendent )， 等 等 ， 关 系 直 截 了 
当 。 在 树 中 没有 孩子 的 元 素 称 为 叶子 (leaf )。 在 图 11-1 中 ，Ann、Mark、Sue 和 Chris 是 树 的 
叶子 。 树 根 是 树 中 唯一 一 个 没有 父母 的 元 素 。 

例 11-6 在 公司 机 构 的 例子 中 ( 见 例 11-2 )， 公 司 雇 员 是 树 的 元 素 。 总 裁 是 树 的 根 ， 
余下 的 雇员 划分 成 不 相交 的 集合 ， 代 表 公 司 的 不 同 分 支 机 构 。 每 个 分 支 机 构 有 一 个 副 总 裁 ; 
分 支 机 构 用 子 树 表 示 ， 副 总 裁 是 子 树 的 根 。 分 支 机 构 的 余下 元 素 划 分 为 不 相交 的 集合 ， 代 
表 不 同 的 部 门 ; 这 些 部 门 是 子 树 ， 部 长 是 子 树 的 根 。 部 门 余 下 元 素 同 样 可 划分 为 不 同 的 科 
室 等 。 

副 总 裁 是 总 裁 的 子 节点 ， 部 长 是 副 总 裁 的 子 节 点 。 总 裁 是 副 总 裁 的 父 节 点 ， 每 个 副 总 裁 
是 其 部 门 主 管 的 父 节 点 。 

在 图 11-3 中 ， 根 是 联邦 政府 。 其 子 树 的 根 为 国防 部 、 教 育 部 …… 税务 部 等 ， 它 们 是 联邦 
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政府 的 子 节点 。 联 邦 政府 是 这 些 子 节点 的 父 节 点 。 国 防 部 的 子 节点 是 陆军 、 海 军 、 空 军 、 海 
军 陆 战 队 ， 它 们 是 兄弟 节点 ， 同 时 也 是 叶子 。 面 

树 的 另 一 常用 术语 为 级 ( level )。 树 根 是 1 级 ， 其 孩子 ( 如 果 有 ) 是 2 级， 孩子 的 孩子 是 
3 级 .等 等 。 -在 图 11-3 中 ， 联 邦 政府 是 1 级 ， 国 防 部 、 教 育 部 、 税 务 部 是 2 级 ,陆军 、 海 
军 、 空 军 和 海军 陆 战 队 是 3 级 。 

一 棵 树 的 高 度 ( height ) 或 深度 ( depth ) 是 树 中 级 的 个 数 。 在 图 11-1、 图 11-3 和 图 11-4 
中 ， 树 的 高 度 都 是 3。 

一 个 元 素 的 度 ( degree of an element ) 是 指 其 孩子 的 个 数 。 叶 节点 的 度 为 0， 在 图 11-4 
中 ， 文 件 模块 的 度 为 5。 一 棵 树 的 度 ( degree of a tree ) 是 其 元 素 的 度 的 最 大 值 。 


1. 解释 为 什么 图 11-1 是 一 棵 树 。 标 出 根 节点 ， 标 出 每 个 节点 的 级 和 度 . 树 的 深度 是 多 少 ? 
2. 对 图 1-3 完成 练习 1。 
3. 用 一 棵 树 来 表示 本 书 的 主要 元 素 ( 整 本 书 、 章 、 节 、 小 节 )。 
1 ) 共有 多 少 个 元 素 ? 
2 ) 标 出 叶 节 点 。 
3 ) 标 出 第 3 级 元 素 。 
4) 给 出 每 个 元 素 的 度 。 
4. 在 万 维 网 上 访问 你 所 在 部 门 的 主页 (或 者 访问 http:// wwwi.cise.ufl.edu )。 
1 ) 通过 链接 ， 深 入 访问 下 一 级 的 网 页 ， 绘 出 网 页 间 的 层次 结构 。 用 节点 表示 网 页 ， 用 边 连 
接 网 页 节点 。 
2 ) 此 结构 一 定 是 一 棵 树 吗 ? 为 什么 ? 
3 ) 若 此 结构 是 一 棵 树 ， 指 出 其 根 节点 和 时节 点 。 


11.2 二叉树 


定义 11-2 一 棵 二 叉 树 (binary tree ) 上 是 有 限 个 元 素 的 集合 (可 以 为 空 )。 当 二 又 树 非 
空 时 ， 其 中 有 一 个 元 素 称 为 根 ， 余 下 的 元 素 (如 果 有 的 话 ) 被 划分 成 两 棵 二 又 树 ， 分 别称 为 ; 
的 左 子 树 和 右 子 树 。 

二 义 树 和 树 的 根本 区 别 是 : 

e 一 义 树 的 每 个 元 素 都 恰好 有 两 棵 子 树 ( 其 中 一 个 或 两 个 可 能 为 空 )。 而 树 的 每 个 元 素 

可 有 任意 数量 的 子 树 。 
e 在 二 又 树 中 ， 每 个 元 素 的 子 树 都 是 有 序 的 ， 也 就 是 说 ， 有 左 子 树 和 右 子 树 之 分 。 而 树 
的 子 树 是 无 序 的 。 

树 和 二 又 树 的 另 一 个 区 别 大 概 与 定义 有 关 ， 二 叉 树 可 以 为 空 ， 但 树 不 能 为 空 。 有 的 作者 
放宽 了 对 树 的 定义 ， 人 允许 树 为 空 。 

和 树 一 样 ， 二 又 树 也 是 根 节点 在 顶部 。 二 叉 树 左 ( 右 ) 子 树 中 的 元 素 画 在 根 的 左 ( 右 ) 
下 方 。 每 个 元 素 节点 和 其 子 节点 之 间 用 一 条 边 相 连 。 

图 11-5 是 用 二 叉 树 表示 的 算术 表达 式 。 每 个 操作 符 (+、-、*、/) 有 一 个 或 两 个 操作 数 。 


名 有些 作者 为 树 的 级 编号 是 从 0 开始 的 ， 而 不 是 1。 这 时 ， 树 的 根 是 0 级 。 


库 二 部 分 缆 拘 结 鸡 


左 操作 数 是 操作 符 的 左 子 树 ， 右 操作 数 是 操作 符 的 右 子 树 。 树 的 叶 节 点 为 常量 或 变量 。 注 意 ， 
算术 表达 式 树 没 有 括号 。 


a) (axb)+(c/d) b) ((atb)+c)+d c) (Ca)+ (r+y))/ (+h) *# (cxa)) 
图 11-5 ”表达 式 树 
算术 表达 式 树 的 一 个 应 用 是 生成 优化 的 计算 机 代码 以 计算 表达 式 的 值 。 不 过 ， 我 们 并 不 


研究 优化 代码 的 生成 算法 ,我 们 只 是 用 算术 表达 式 树 来 说 明 一 些 通常 可 以 用 二 又 树 来 表示 的 
操作 。 





练习 


5. 1 ) 标 出 图 11-5 中 二 又 树 的 叶子 。 
2 ) 标 出 图 11-5b 的 所 有 第 3 级 节点 。 
3 ) 图 11-5c 的 第 4 级 有 多 少 个 节点 ? 
6. 画 出 如 下 每 个 表达 式 的 二 又 树 : 
1 ) (a+b)/(c-d)+e+g*h/a, 
2 ) —x—y*z+(a+b+c/d*e)。 
3 ) ((a+b)>(c-e))lla<b&&(x<ylly>z)。 


11.3 二叉树 的 特性 


特性 11-1 一 棵 二 又 树 有 nn 个 元 素 ,，n>0， 它 有 nh-l 条 边 。 

证 明 二 又 树 的 每 个 元 素 (除了 根 节点 ) 有 且 只 有 一 个 父 节点 。 在 子 节点 与 父 节点 间 有 
且 只 有 一 条 边 ， 因 此 边 数 为 n-1。 国 

特性 11-2 一 棵 二 又 树 的 高 度 为 h，h 宇 0， 它 最 少 有 有 个 元 素 ， 最 多 有 2”-1 个 元 素 。 

证 明 ”因为 每 一 级 最 少 有 1 个 元 素 ， 因 此 元 素 的 个 数 最 少 为 h。 每 个 元 素 最 多 有 2 个 子 
节点 ， 则 第 i 层 节 点 元 素 最 多 为 2-1 个 ，i>0。 当 h=0 时 ， 元素 的 总 数 为 0， 也 就 是 2"-1。 当 


h>0 时 ， 元 素 的 总 数 不 会 超过 2 = 2- 1 。 辣 


特性 11-3 一 可 二 又 树 有 nn 个 元 素 ， n>0， 它 的 高 度 最 大 为 n， 最 小 高 度 为 [log;(n+1)|。 
证 明 因为 每 层 至 少 有 一 个 元 素 ， 因 此 高 度 不 会 超过 m。 由 特性 11-2 可 以 得 知 ， 高 度 为 
有 hh 的 二 又 树 最 多 有 2 和 1 个 元 素 。 因 为 n < 2*-1， 所 以 hh 大 logz(n+1)。 由 于 h 是 整数 ， 所 以 
h=[log:(n+1)|。 国 
当 高 度 为 h 的 二 又 树 恰好 有 2 和 -1 个 元 素 时 ， 称 其 为 满 二 叉 树 ( full binary tree )。 图 11-5a 
是 一 个 高 度 为 3 的 满 二 又 树 。 图 11-5b 和 图 11-5c 不 是 满 二 又 树 。 图 11-6 是 高 度 为 4 的 满 二 
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叉 树 。 

对 高 度 为 的 满 二 又 树 的 元 素 ， 从 第 
一 层 到 最 后 一 层 ， 在 每 一 次 中 从 左 至 右 ， 
顺序 编号 ， 从 1 到 2-1 ( 如 图 11-6 所 示 )。 
假设 从 满 二 叉 树 中 删除 个 其 编号 为 2"-i 
元 素 , 1 < i<k<23， 所 得 到 的 二 又 树 
被 称 为 完全 二 叉 树 ( complete binary tree )- 
图 11-7 是 三 棵 完全 二 又 树 。 满 二 又 树 是 完 
全 二 义 树 的 一 个 特例 。 有 个 元 素 的 完全 二 又 树 ， 其 高 度 为 [log;(n+ 1)]。 


Kp 


图 11-7 完全 二 又 树 


在 完全 二 又 树 中 ， 一 个 元 素 与 其 孩子 的 编号 有 非常 好 的 对 应 关系 ， 特 性 11-4 便 是 这 种 
关系 。 

特性 11-4 ” 设 完 全 二 又 树 的 一 元 素 其 编号 为 i，1 夺 i 万 n。 有 以 下 关系 成 立 : 

1 ) 如 果 i=1， 则 该 元 素 为 二 又 树 的 根 。 若 i>1， 则 其 父 节 点 的 编号 为 [i/2|。 

2 ) 如 果 2i>n， 则 该 元 素 无 左 孩 子 。 否 则 ， 其 左 孩 子 的 编号 为 2i。 

3 ) 如 果 2i+t1>n， 则 该 元 素 无 右 孩 子 。 否 则 ， 其 右 孩 子 的 编号 为 2i+1。 

证 明 ”对 i 进行 归纳 即 可 得 证 。 画 





图 11-6 高 度 为 4 的 满 二 又 树 


练习 


7. 证 明 特 性 11-4。 
8. 在 一 棵 大 又 树 (大 > 1 ) 中 ， 每 个 节点 最 多 有 大 个 孩子 ， 这 些 子 节点 分 别称 为 该 节点 的 第 一 
个 、 第 二 个 ……， 第 上 个 孩子 。 
1 ) 对 又 树 ， 确 定 类 似 特 性 11-1 的 性 质 。 
2 ) 对 大 又 树 ， 确 定 类 似 特性 11-2 的 性 质 
3 ) 对 上 又 树 ， 确 定 类 似 特性 11-3 的 性 质 
4 ) 对 又 树 ， 确 定 类 似 特 性 11-4 的 性 质 
9. 有 w 个 叶子 的 二 又 树 最 多 有 和 多少 个 节点 ? 


11.4 二叉树 的 描述 


11.4.1 数组 描述 


二 又 树 的 数组 表示 利用 了 特性 11-4， 把 二 又 树 看 做 是 缺少 了 部 分 元 素 的 完全 二 又 树 ， 如 
图 11-8 的 两 棵 二 又 树 所 示 。 第 一 棵 二 又 树 有 三 个 元 素 (A、B 和 C), 第 二 棵 二 又 树 有 五 个 元 
素 (A、B、C、D 和 E)。 没 有 阴影 的 圈 表 示 缺 少 的 元 素 。 所 有 的 元 素 ( 包括 缺少 的 元 素 ) 按 
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前 面 介绍 的 方法 编号 。 

在 数组 表示 中 ， 二 又 树 的 元 素 按照 其 
编号 存储 在 数组 的 相应 位 置 。 图 11-8 有 二 
叉 树 的 数组 表示 ( 没有 给 出 数组 的 0 位 CY 
置 )。 缺 少 的 元 素 用 白色 方 格 表示 。 可 以 看 4 5 6 







出 ， 当 缺少 的 元 素 很 多 时 ， 这 种 表示 方法 ( ) ( ) (1) 


非常 浪费 空间 。 一 个 有 个 元 素 的 二 叉 树 
可 能 最 多 需要 2" 个 空间 来 存储 ( 包括 数组 
的 0 位 置 ) 当 根 节点 以 外 的 每 个 节点 都 是 
其 父 节点 的 右 孩子 时 ， 存 储 空间 最 大 ， 
图 11-9 便 是 这 样 一 棵 具有 4 个 元 素 的 二 又 4 
树 。 这 种 类 型 的 二 又 树 称 为 右 斜 二 叉 树 () 
( right-skewed binary tree )。 注 意 ， 如 果 二 
又 树 的 编号 不 是 从 1 开始 ， 而 是 从 0 开 
始 ， 那 么 最 坏 情况 的 空间 需求 是 2"_1。 

只 有 当 缺 少 的 元 素数 目 比较 少时 ， 这 
种 描述 方法 才 是 有 用 的 。 


11.4.2 ”链表 描述 


二 又 树 最 常用 的 表示 方法 是 用 指针 。 
每 个 元 素 用 一 个 节点 表示 ， 节 点 有 两 个 指 
针 域 ， 分 别称 为 leftChild 和 rightChild。 
除 两 个 指针 域 之 外 ， 每 个 节点 还 有 一 个 
element 域 。 这 种 节点 结构 用 程序 11-1 的 








b) 数组 表示 
图 11-9 右 斜 二 叉 树 


C++ 结构 binaryTreeNode 来 实现 。 其 中 有 三 个 构造 函数 的 实现 代码 。 第 一 个 无 参数 ， 两 个 指 
针 域 被 置 为 NULL ; 第 二 个 有 一 个 参数 ， 可 用 来 初始 化 element， 而 指针 域 被 置 为 NULL ; 第 


三 个 有 3 个 参数 ， 可 用 来 初始 化 3 个 域 。 


程序 11-1 ”链表 二 又 树 的 节点 结构 


template <class T> 
struct binaryTreeNode 
{ 


T element; 


binaryTreeNode<T> *leftChilgd, // 左 子 树 
*rightchild; 1/ 右 子 树 
binaryTreeNode() {leftcChild = rightChild = NULL;} 


binaryTreeNode (const T& theElement) 
{ 
element (theElement) 
leftchild = rightchild = NULL; 
} 
binaryTreeNode (const Tg& theElement, 
binaryTreeNode *theLeftCchild, 
binaryTreeNode *theRightChild) 
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{ 
element (theElement) 
leftChild = theLeftChild; 
rightchild = theRightchild; 
} 
}; 


父 节 点 的 每 一 个 指向 孩子 的 指针 表示 一 条 边 。 因 为 n 个 元 素 的 二 叉 树 仅 有 n-1 条 边 ， 所 
以 有 2n-(n-1)=n+1 个 指针 域 没有 值 ， 它 们 被 置 为 NULL。 图 11-10 是 图 11-8 的 链表 表示 。 





图 11-10 链 式 表示 


从 根 节点 开始 ， 沿 着 leftChild 和 rightChild 指针 域 ， 可 以 访问 二 叉 树 的 所 有 节点 。 二 又 
树 的 链 式 表示 没有 指向 父 节 点 的 指针 ， 但 一 般 不 会 有 什么 问题 ， 因 为 二 叉 树 的 大 部 分 函数 并 
不 需要 这 种 指针 。 若 某 些 应 用 需要 这 种 指针 ， 可 在 每 个 节点 增加 一 个 指针 域 。 


练习 


10. 对 练习 6 的 表达 式 ， 画 出 二 又 树 的 数组 表示 。 
11. 对 图 11-5 的 二 叉 树 ， 做 练习 10。 


11.5 二叉树 常用 操作 


二 叉 树 的 常用 操作 有 : 

e 确定 高 度 。 

e 确定 元 素数 目 。 

e 复制 。 

e 显示 或 打印 二 叉 树 。 

e 确定 两 棵 二 又 树 是 否 一 样 。 

e 删除 整 棵 树 。 

这 些 操 作 可 以 通过 有 步骤 地 遍历 二 又 树 来 完成 。 在 二 又 树 的 遍历 ( traversal ) 中 ， 每 个 元 
素 仅 被 访问 一 次 。 访 问 一 个 元 素 ， 意 味 着 可 以 对 该 元 素 实施 任何 操作 。 这 些 操 作 可 以 是 : 显 
示 或 打印 该 元 素 ; 计算 以 该 元 素 为 根 的 子 树 所 表示 的 数学 表达 式 ; 对 二 又 树 的 元 素 个 数 加 1。 


11.6 二叉树 遍历 


有 4 种 遍历 二 又 树 的 常用 方法 : 
。 前 序 遍历 。 


278 淄 二 序 分 阁 握 结 移 





e 中 序 遍 历 。 

e 后 序 遍 历 。 

e 层次 遍历 。 

前 三 种 遍历 方法 在 程序 11-2 、 程 序 11-3 和 程序 11-4 中 给 出 。 假 设 要 遍历 的 二 叉 树 采用 
前 一 节 所 介绍 的 链表 方法 来 描述 。 


程序 11-2 ”前 序 遍 历 


template <class T> 
void preOrder (binaryTreeNode<T> *t) 


{VW 前 序 遍 历 二 叉 树 *t 


if (t != NULL) 

{ 
visttbtty? /访问 树 根 
preOrder (t->leftChild); 1/ 前 序 遍历 左 子 树 
preOrder (t->rightchild); 1/ 前 序 遍 历 右 子 树 





程序 11-3 ”中 序 遍 历 
template <class T> 
void inOorder (binaryTreeNode<T> *t) 


{1/ 中 序 遍 历 二 叉 树 xf 


if (t != NULL) 

{ 
inorder (t->leftchild); 1/ 中 序 遍 历 左 子 树 
visit(t); /访问 树 根 
inorder (t->rightchild); 1/ 中 序 遍 历 右 子 树 


程序 11-4 ”后 序 遍 历 


template <class T> 
void postOrder (binaryTreeNode<T> *t) 


{// 后 序 遍 历 二 又 树 + 七 


if (t != NULL) 

{ 
postorder (t->leftchild); 1/ 后 序 廊 历 左 子 树 
postOrder (t->righntchild); 1// 后 序 遍 历 右 子 树 
visit (七 ) ; /访问 树 根 


} 


在 前 三 种 方法 中 ， 每 个 节点 的 左 子 树 在 其 右 子 树 之 前 遍历 。 这 三 种 遍历 的 区 别 在 于 对 每 
个 节点 的 访问 时 间 不 同 。 在 前 序 遍 历 中 ， 先 访问 一 个 节点 ， 再 访问 该 节点 的 左右 子 树 ; 在 中 
序 遍 历 中 ， 先 访问 一 个 节点 的 左 子 树 ， 然 后 访问 该 节点 ， 最 后 访问 右 子 树 。 在 后 序 遍 历 中 ， 
先 访问 一 个 节点 的 左右 子 树 ， 再 访问 该 节点 。 

图 11-11 是 程序 11-2 ~ 程序 11-4 的 输出 结果 ， 其 中 visit(t) 如 程序 11-5 所 示 ， 输 入 的 二 
叉 树 是 图 11-5。 
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程序 11-5 ”visit 函数 


template <Class T> 

void visit (binaryTreeNode<T> *x) 

{1/ 访问 节点 *x， 仅 输出 element 域 
cout << x->element << ' ' 

} 


+*ab/cd +++abcd /+-atxy*+b*ca 


a*b+c/d atb+c+d —a+x+y/+b*c*a 


ab*cad/+ ab+rc+d+ Qa—xy++b+ca**/ 


c) 
图 11-11 二 叉 树 按 前 序 、 中 序 、 后 序 遍历 所 列 出 的 元 素 





对 一 棵 数学 表达 式 树 分 别 进行 中 序 、 前 序 和 后 序 遍 历 ， 结 果 便 是 表达 式 的 中 级 、 前 
缀 和 后 缀 形式 。 中 缀 (infix ) 形式 是 我 们 通常 的 书写 形式 。 在 这 种 形式 中 ， 每 个 二 元 操作 
符 ( 即 有 两 个 操作 数 的 操作 符 ) 出 现在 左 操作 数 之 后 ， 右 操作 数 之 前 。 一 个 表达 式 用 二 又 
树 来 表示 时 不 能 有 歧义 ， 即 操作 数 和 操作 符 之 间 的 关系 是 由 表达 式 唯 一 确定 的 。 但 是 用 中 
缀 形式 表示 可 能 会 产生 一 些 歧义 。 例 如 ，x+y*z 是 解释 为 (x+y)*z 还 是 x+(y*z) 呢 ?7 为 了 避 
免 这 种 歧义 ， 可 对 操作 符 加 上 优先 级 ， 然 后 用 优先 级 规则 来 分 析 中 组 表达 式 。 必 要 时 ， 还 
可 以 用 如 括号 来 代替 优先 级 。 在 完全 括号 化 的 中 组 表达 式 中 ， 每 个 操作 符 和 相应 的 操作 数 
都 用 一 对 括号 括 起 来 。 更 甚 者 把 操作 符 的 每 个 操作 数 也 都 用 一 对 括号 括 起 来 。 如 ((x)+(y))、 
((X)+((y)*(z))) 和 ((((X)+(y))*((y)+(z)))*(w))。 通 过 修改 程序 11-6 的 中 序 遍 历 算法 可 以 得 到 
这 种 表达 形式 。 


程序 11-6 ”输出 完全 括号 化 的 中 缀 表达 式 


template <class T> 
void infix(binaryTreeNode<T> *t) 
{// 输出 中 级 表达 式 
if (t != NULL) 
{ 
GOUt ee "0'sF 
infix(t->leftchild); // 左 操作 数 
cout << t->element; // 操作 符 
infix(t->rightchild); 11/ 右 操 作 数 
COut eu T's 
} 
} 


在 后 缀 (postfix ) 表达 式 中 ， 每 个 操作 符 跟 在 操作 数 之 后 ， 操 作 数 从 左 到 右 顺 序 出 现 。 
在 前 缀 (prefix ) 表达 式 中 ， 操 作 符 位 于 操作 数 之 前 ， 操 作 数 从 左 到 右 顺序 出 现 。 前 级 和 后 缀 
表达 式 不 会 存在 歧义 。 因 此 ， 在 前 经 和 后 缀 表达 式 中 都 不 必 采 用 括号 或 优先 级 。 利 用 操作 数 
栈 ， 从 左 到 右 或 从 右 到 左 扫描 表达 式 ， 很 容易 确定 操作 数 和 操作 符 的 关系 。 在 扫描 中 ， 若 遇 
到 一 个 操作 数 ， 则 把 它 压 人 堆栈 。 若 遇 到 一 个 操作 符 ， 则 将 其 与 栈 顶 的 操作 数 相 匹 配 。 把 这 
些 操作 数 弹 出 栈 ， 由 操作 符 执行 相应 的 计算 ， 然 后 将 计算 结果 压 人 操作 数 栈 。 

在 层次 遍历 中 ， 从 顶层 到 底层 ， 在 同一 层 中 ， 从 左 到 右 ， 依 次 访问 树 的 元 素 。 因 为 层次 
遍历 需要 队列 而 不 是 栈 ， 所 以 编写 递归 程序 很 困难 。 程 序 11-7 是 一 个 层次 遍历 程序 。 
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程序 11-7 层次 遍历 


template <class T> 
void levelOrder (binaryTreeNode<T> *t) 
{1/ 层次 遍历 二 又 树 * 
arrayQueue<binaryTreeNode<T>*> q; 
while (tt != NULL) 
{ 
visit(t);} /访问 七 


/将 寺 的 孩子 插入 队列 

if (t->leftChild != NULL) 
q.push (七 ->1eftCchild) 

if (t->rightChild != NULL) 
G.Push (t->rightchild); 


/提取 下 一 个 要 访问 的 节点 

try {t = gd.front'();} 

catch (queueEmpty) {return;} 
q:pop(); 


} 


在 程序 11-7 中 ， 仅 当 树 非 空 时 ， 才 进入 while 循环 。 进 入 while 循环 之 后 ， 首 先 访问 根 
节点 ， 再 把 其 子 节点 ( 如果 有 ) 加 到 队列 中 ， 然 后 访问 队 首 元 素 。 若 队列 为 室 ， 则 front0 抛 
出 一 个 类 型 为 queueEmpty 的 异常 ; 若 队列 不 空 ， 则 front0 的 返回 值 指 向 队 首 元 素 指针 ， 下 一 
次 循环 将 访问 这 个 元 素 。 

设 一 棵 二 又 树 有 个 元 素 。 这 四 种 遍历 算法 的 空间 和 时 间 复 杂 性 均 为 O(n)。 先 看 空间 需 
求 ， 当 树 的 高 度 为 n 时 ( 如 图 11-9 的 右 斜 二 又 树 )， 前 序 、 中 序 和 后 序 遍 历 所 使 用 的 递归 栈 
空间 是 @(n) ; 当 树 为 满 二 叉 树 时 ， 层 次 遍历 所 需要 的 队列 空间 为 9(n)。 再 看 时 间 需 求 ， 假 设 
访问 一 个 节点 的 时 间 为 6(1)， 每 个 遍历 算法 花 在 一 个 节点 上 的 时 间 为 @(1)。 


练习 


12. 分 别 按 前 序 、 中 序 、 后 序 和 层次 顺序 ， 列 出 图 11-10 的 节点 。 

13. 对 图 11-6 的 满 二 又 树 完成 练习 12。 

14. 对 练习 6 的 表达 式 ， 分 别 按 前 序 、 中 序 、 后 序 和 层次 顺序 ， 列 出 二 又 树 节点 。 

15. 一 棵 二 叉 树 的 节点 编号 从 a 到 h， 前 序 序列 是 abcdefgh， 中 序 序列 是 cdbagfeh。 画 出 这 棵 
二 叉 树 。 列 出 后 序 和 层次 序列 。 

16. 一 棵 二 又 树 的 节点 编号 从 a 到 1， 前 序 序列 是 abcdefghijkl， 中 序 序列 是 aefdcgihjklb。 夯 出 
这 棵 二 叉 树 。 列 出 后 序 和 层次 序列 。 

17. 一 棵 二 文 树 的 节点 编号 从 a 到 h， 后 序 序列 是 abcdefgh， 中 序 序列 是 aedbchgf。 画 出 这 棵 
二 叉 树 。 列 出 前 序 和 层次 序列 。 

18. 一 棵 二 又 树 的 节点 编号 从 a 到 1， 后 序 序列 是 abcdefghijkl， 中 序 序列 是 backdejifghl。 画 出 
这 棵 二 叉 树 。 列 出 前 序 和 层次 序列 。 

19. 画 出 两 棵 二 又 树 ， 它 们 的 前 序 序列 是 abcdefgh， 后 序 序 列 是 dcbgfhea。 列 出 中 序 和 层次 序列 。 

20. 对 一 棵 用 数组 描述 的 二 又 树 ， 编 写 前 序 遍 历程 序 。 假 设 二 又 树 的 元 素 存储 在 数组 a 中 ， 其 
中 last 是 树 中 最 后 一 个 元 素 的 位 置 。 数 组 元 素 类 型 是 pair<bool,T>， 其 中 afi].first 为 true， 
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当 目 仅 当 在 位 置 i 有 一 个 元 素 ( ali].second ) 给 出 该 程序 的 时 间 复 杂 度 。 

21. 按 中 序 遍 历 方法 完成 练习 20。 

22. 按 后 序 遍 历 方法 完成 练习 20。 

23. 按 层次 遍历 方法 完成 练习 20。 

24. 编写 一 个 C++ 函数 ， 复 制 一 个 数组 表示 的 二 又 树 。 

25. 编写 两 个 C++ 函数 ， 复 制 用 binaryTreeNode 节点 结构 表示 的 二 又 树 。 第 一 个 函数 按 后 序 
遍历 ， 第 二 个 按 前 序 遍 历 。 两 个 函数 所 需要 的 递归 栈 空间 有 什么 不 同 ? 

26. 编写 一 个 函数 ， 计 算 用 binaryTreeNode 节点 结构 表示 的 表达 式 树 的 值 。 为 树 的 元 素 假 设 一 
个 合适 的 数据 类 型 。 

27. 编写 一 个 函数 ， 计 算 一 棵 链 式 二 又 树 的 高 度 。 确 定 其 时 间 复 杂 性 。 

28. 编写 一 个 函数 ， 计 算 一 棵 链 式 二 叉 树 的 节点 个 数 。 确 定 其 时 间 复 杂 性 。 

29. 编写 一 个 函数 ， 确 定 一 棵 链 式 二 叉 树 在 哪 一 层 具 有 最 多 的 节点 ( 提示 : 用 层次 遍历 )。 确 
定 其 时 间 复 杂 性 。 

30. 写 一 个 迭代 函数 ， 中 序 遍 历 链 表 二 又 树 。 可 以 用 数组 作为 栈 。 函 数 尽 可 能 简练 。 需 要 多 少 
栈 空 间 ? 给 出 栈 空间 大 小 与 二 又 树 高 度 的 函数 关系 。 

31. 按 前 序 遍 历 方法 完成 练习 30。 

32. 按 后 序 遍 历 方 法 完成 练习 30。 

33. 设 有 一 棵 二 叉 树 ， 每 个 节点 的 数据 都 不 相同 。 数 据 域 的 前 序 和 中 序 序列 是 否 可 以 唯一 地 确 
定 这 棵 二 又 树 ? 如 果 可 以 ， 编 写 一 个 函数 ， 用 前 序 和 中 序 序列 来 构造 这 棵 二 又 树 。 计 算 函 
数 的 时 间 复 杂 性 。 

34. 按 前 序 和 后 序 遍 有 历 方 法 完成 练习 33。 

35. 按 后 序 和 中 序 遍历 方法 完成 练习 33。 

36. 编写 一 个 C++ 函数 ， 输 入 后 级 表达 式 ， 构 造 其 二 叉 树 表示 。 假 设 每 个 操作 符 有 一 个 或 两 
个 操作 数 。 

37. 用 前 级 表达 式 完成 练习 36。 

38. 编写 一 个 C++ 函数 ， 把 后 缀 表达 式 转换 为 完全 括号 化 的 中 缀 表达 式 。 

39. 用 前 缀 表达 式 完成 练习 38。 

40. 编写 一 个 函数 ， 把 一 个 中 组 形式 表达 式 (不 一 定 是 完全 括号 化 的 ) 转换 成 后 级 表达 式 。 假 
定 操作 符 可 以 是 二 元 操作 符 +、-、*、/， 分 界 符 可 以 是 左 括号 ( ) 和 右 括号 ( )。 因 为 操 
作 数 的 顺序 在 中 级、 前 级 、 后 缀 表达 式 中 都 是 一 样 的 ， 所 以 在 从 中 缀 向 前 级 或 后 级 转换 
时 , 仅 需 要 从 左 到 右 扫 描 中 缀 表达 式 。 把 扫描 到 的 操作 数 直接 输出 ， 而 遇 到 的 操作 符 保留 
在 栈 中 ， 根 据 操作 符 和 左 括号 的 优先 级 来 确定 输出 。 假 定 + 和 - 的 优先 级 为 1，* 和 /的 优 
先 级 为 2。 栈 外 的 左 括号 优先 级 为 3， 栈 内 的 左 括号 优先 级 为 0。 

41. 完成 练习 40, 但 是 生成 前 缀 表达 式 。 

42. 完成 练习 40， 但 是 生成 二 又 树 形式 。 

43. 编写 一 个 函数 ， 计 算 后 绥 表 达 式 的 值 。 假 设 表 达 式 以 数组 方式 表示 。 


11.7 抽象 数据 类 型 BinaryTree 


既然 我 们 对 二 又 树 已 经 有 了 一 些 了 解 ， 现 在 可 以 用 抽象 数据 类 型 来 说 明 二 叉 树 ( 见 ADT 
11-1 )。 我 们 希望 对 二 又 树 的 操作 可 能 很 多 ,但 这 里 只 列 出 了 几 个 常用 的 操作 。 
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抽象 数据 类 型 binaryTree 


元 素 集合 ; 如 果 非 空 ， 则 集合 划分 为 一 个 根 、 一 棵 左 子 树 和 一 棵 右 子 树 ; 每 一 棵 子 树 也 是 二 又 树 









empty(): 若 树 为 室 ， 则 返回 true ， 否 则 返回 false 
size(): 返回 二 叉 树 的 节点 / 元 素 个 数 
preOrder(visit): 前 序 遍 历 二 叉 树 ;visit 是 访问 函数 
inOrder(visit): 中 序 遍历 二 又 树 
PostOrder(visit): 后 序 遍 历 二 又 树 
levelOrder(visit): 层次 遍历 二 叉 树 
} 
















ADT 11-1 二 又 树 的 抽象 数据 类 型 


程序 11-8 是 表述 抽象 数据 类 型 binaryTree 的 C++ 抽象 类 binaryTree。 类 了 T 是 二 叉 树 节点 
的 数据 类 型 。 其 中 ， 二 又 树 遍历 方法 的 参数 类 型 


Vode 人 
是 一 种 函数 类 型 ， 这 种 函数 的 返回 值 类 型 是 void， 它 的 参数 类 型 是 T*。 
程序 11-8 二叉树 抽象 类 


template<class 了 > 
class binaryTree 
{ 
public: 
virtual ~binaryTree() 1{]} 
virtual bool empty() const = 0; 
virtual int size() const = 0; 


virtual void preOrder(void (*) (T *)) = 0; 
virtual void inOrder(void (*) (T *)) = 0; 
virtual void postOrder(void (*) (T *)) = 0; 
virtual void IevelOrder (void (*) (T *)) = 0; 


11.8 类 linkedBinaryTree 


类 linkedBinaryTree 是 抽象 类 binaryTree 的 派生 类 ， 节 点 的 类 型 是 binaryTreeNode ( 见 程 
序 11-1 )。 程 序 11-9 是 类 linkedBinaryTree 的 数据 成 员 和 一 部 分 私有 和 公有 方法 。 

类 linkedBinaryTree 有 两 个 数据 成 员 实例 root 和 treeSize。root 是 指向 二 叉 树 节 点 的 指针 ， 
treeSize 是 二 又 树 节 点 个 数 。 类 linkedBinaryTree 有 一 个 静态 数据 程序 成 员 visit， 它 是 一 个 函 
数 指针 ， 这 个 函数 返回 值 类 型 是 void， 参 数 是 binaryTreeNode 类 型 的 指针 。 静 态 方法 dispose 
删除 一 个 节点 ， 方 法 erase 利用 静态 方法 dispose 作为 函数 指针 visit 方法 ， 在 后 序 遍 历 过 程 中 
删除 二 叉 树 所 有 节点 。 


程序 11-9 类 linkedBinaryTree 的 数据 成 员 和 访问 方法 


template<class E> 





class linkedBinaryTree : public binaryTree<binaryTreeNode<E> > 


{ 


甸 11 和音 二 又 机 机 其 他 才 283 


public: 
linkedBinaryTree() {root = NULL; treeSize = 0;} 
~linkedBinaryTree() {erase();}; 
bool empty() const {return treeSize == 0;} 
int size() const {return treeSize;} 
void preOrder (void(*theVvisit) (binaryTreeNode<E>*)) 
{visit = theVisit; preOrder (root);} 
void inOrder (void(*theVisit) (binaryTreeNode<E>*)) 
{visit = theVisit inOrder (root);} 
void postOrder (void(*theVisit) (binaryTreeNode<E>*)) 
{visit = theVisit; postOrder (root);} 
void levelOrder (void(*) (binaryTreeNode<E> *));} 
void erase () 
{ 
PostOrder (dispose); 
root = NULL; 
treeSize = 07 


} 


private: 
binaryTreeNode<E> *root; /指向 根 的 指针 
int treeSize; 1/ 树 的 节点 个 数 
static void (*visit) (binaryTreeNode<E>*); /访问 函数 


static void preOrder (binaryTreeNode<E> * 七 ) 

static void inOrder (binaryTreeNode<E> *t); 

static void postOrder (binaryTreeNode<E> *t); 

static void dispose (binaryTreeNode<E> *t) {delete 七 7} 
}; 


程序 11-10 是 前 序 遍 历 方法 。 公 有 遍历 方法 preOrder 先 给 静态 数据 成 员 visit 赋值 ， 得 到 
访问 节点 的 函数 ， 然 后 调用 私有 递归 方法 preOrder， 它 是 实际 上 执行 前 序 遍 历 的 函数 。 相 应 
的 中 序 和 后 序 方法 类 似 。 


程序 11-10 ”类 linkedBinaryTree 的 私有 前 序 遍 历 方法 


template<class E> 
void linkedBinaryTree<E>:;:;preOrder (binaryTreeNode<E> *t) 
{/ 前 序 遗 历 
if (t != NULL) 
{ 
linkedBinaryTree<E>: :visit(t); 
preorder (t->leftchild); 
preOrder (t->rightChild); 


层次 遍历 代码 与 程序 11-7 非常 相似 。 我 们 可 以 增加 一 个 方法 ， 按 前 序 顺序 输出 二 叉 树 节 
点 ， 只 需 把 代码 


void preOrderOutput () {preorder (output) ;cout<<endl;} 
加 到 程序 11-9 的 公有 部 分 。 把 代码 


static void output (binaryTreeNode<E> *t) 
{cout<<t->element<<’” “;] 


加 到 私有 部 分 。 中 序 、 后 序 和 层次 遍历 的 代码 与 此 类 似 。 


2 
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程序 11-11 是 给 类 linkedBinaryTree 增加 的 一 个 成 员 函 数 和 一 个 相应 的 私有 静态 递归 方 


法 。 它 利用 后 序 遍 历 方法 计算 二 又 树 的 高 度 。 它 首先 取得 左 子 树 的 高 度 ， 然 后 取得 右 子 树 的 
高 度 ， 最 后 把 左右 子 树 高 度 的 最 大 者 加 上 1， 取 得 树 的 高 度 。 


程序 11-11 确定 二 叉 树 高 度 
int height() const {return height (root);} 
template <class E> 


int linkedBinaryTree<E>: :height (binaryTreeNode<E> *t) 


{/ 返回 根 为 *t 的 树 的 高 度 


iE (Et == NLL) 
return 0; 1/ 空 树 

int hl = height (t->leftChild); // 左 树 高 

int hr = height(t->rightChild) // 右 树 高 


if (hl > hr) 
return ++hl1; 
else 
return ++hr; 


练习 


44. 
45. 


46. 


47. 


48. 


49. 


50. 


5 


sh 


52. 


编写 类 linkedBinaryTree 的 一 个 复制 构造 函数 。 测 试 代码 。 计 算 时 间 复 杂 性 。 

编写 方法 linkedBinaryTree<E>::compare(x)， 比 较 二 又 树 *this 与 二 义 树 x。 当 和 且 仅 当 它 们 
相同 时 ， 返 回 true。 测 试 你 的 代码 。 计 算 时 间 复 杂 性 。 

编写 方法 linkedBinaryTree<E>::swapTrees()， 它 交换 每 一 个 节点 的 左右 子 树 。 测 试 你 的 代 
码 。 计 算 时 间 复 杂 性 。 

令 heightDifference(x) 是 节点 x 的 左右 子 树 高 度 的 差 值 。 令 maxHeightDifference(t)=max- 
{heightDifference(x)|x 是 二 又 树 t 的 节点 }。 编 写 方法 linkedBinaryTree<E>::maxHeightDif- 
ference0)， 计 算 二 又 树 的 最 大 高 度 差 。 测 试 你 的 代码 。 计 算 时 间 复 杂 性 。 

设计 类 linkedBinaryTree 的 中 序 迭 代 器 (可 以 借助 练习 30 的 解 )。 对 nn 个 元 素 的 二 叉 树 ， 
计数 节点 数 的 时 间 应 该 是 O(n)。 每 个 方法 的 时 间 复 杂 性 都 不 应 超过 O(h)， 其 中 有 是 树 高 。 
空间 需求 应 该 是 O(h)。 测 试 代码 。 

设计 类 linkedBinaryTree 的 前 序 和 迭代 器 。 不 考虑 把 栈 空 间 加 倍 所 需要 的 时 间 ( 当 用 栈 
arrayStack 时 )， 每 个 方法 的 时 间 复 杂 性 应 是 0(1)。 空 间 需 求 应 是 0(h)。 测 试 代码 。 
设计 类 linkedBinaryTree 的 后 序 迭 代 器 (可 以 借助 练习 32 的 解 )。 对 n 个 元 素 的 二 叉 树 ， 
计数 节点 数 的 时 间 应 该 是 O(n)。 每 个 方法 的 时 间 复 杂 性 都 不 应 超过 O(h)， 其 中 有 是 树 高 。 
空间 需求 应 是 0(h)。 测 试 代码 。 


.设计 类 linkedBinaryTree 的 层次 迭代 器 。 不 考虑 把 队列 大 小 加 倍 所 需要 的 时 间 ( 当 用 队列 


arrayQueue 时 )， 每 个 方法 的 时 间 复 杂 性 应 是 0(1)。 测 试 代码 。 
设计 类 linkedBinaryTree 的 派生 类 expression。 该 类 包括 以 下 操作 : 
1 ) 输出 完全 括号 化 的 中 组 表达 式 。 

2 ) 输出 前 级 和 后 级 表达 式 。 

3 ) 把 前 缀 形式 转换 成 表达 式 树 。 
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4) 把 后 缀 形式 转换 成 表达 式 树 。 
5 ) 把 中 级 形式 转换 成 表达 式 树 。 
6 ) 计算 表达 式 树 的 值 。 

测试 代码 。 


11.9 ”应 用 


11.9.1 设置 信号 放大 器 


1. 问题 描述 

在 一 个 分 布 式 网 络 中 ， 资 源 从 生产 地 送 往 其 他 地 方 。 例 如 ， 汽 油 或 天 然 气 经 过 管道 网 络 ， 
从 生产 基地 送 到 消费 地 。 同 样 的 ， 电 力也 是 通过 电网 从 发 电厂 输送 到 各 消费 点 。 可 以 用 术语 
信和 号 ( signal ) 来 指称 输送 的 资源 ( 汽油、 天 然 气 、 电 力 等 )。 当 信号 在 网 络 中 传输 时 ， 它 在 
某 一 方面 或 某 几 个 方面 的 性 能 可 能 会 损失 或 衰减 。 例 如 ， 天 然 气管 道中 的 气压 会 减少 ， 电 网 
上 的 电压 会 降低 。 另 一 方面 ， 在 信和 号 传输 中 ， 噪 声 会 增加 。 在 信号 从 信和 号 源 到 消费 点 传输 的 
过 程 中 ， 仅 能 容忍 一 定 范 围 内 的 信和 号 衰减 。 为 了 保证 信号 衰减 不 超过 容忍 值 (tolerance )， 应 
在 网 络 中 至 关 重 要 的 位 置 上 放置 信号 放大 器 ( signal booster )。 信 和 号 放大 器 可 以 增加 信和 号 的 
压强 或 电压 使 它 与 源 点 相同 ; 可 以 增强 信号 ， 使 信号 与 噪声 之 比 与 源 点 的 相同 。 本 节 将 设计 
一 个 算法 ， 以 计算 信号 放大 器 的 放置 地 点 。 目 标 是 ， 放 大 器 的 数目 最 少 ， 同 时 保证 信号 衰减 
( 与 源 点 信号 相关 ) 不 超过 给 定 的 容忍 值 。 

为 简化 问题 ， 假 设 分 布 网 络 是 一 树 形 结构 ， 源 点 是 树 的 根 。 树 的 每 一 个 非 根 节 点 表示 一 
个 可 以 放置 放大 器 的 地 点 ， 某 些 节点 同时 也 表示 消费 点 。 信 和 号 从 一 个 节点 流向 其 子 节点 。 图 
11-12 是 一 树 形 分 布 网 络 。 每 条 边 上 的 数字 是 信号 从 父 
节点 流 到 其 子 节点 的 信号 误 减 量 。 误 减 量 的 单位 假设 
可 以 附加 。 在 图 11-12 中 ,信号 从 节点 p 流 到 节点 v 
的 衰减 量 是 5。 从 节点 9 到 节点 x 的 衰减 量 为 3。 如 果 
把 一 个 信号 放大 器 放 在 节点 +， 那么 虽然 当 信号 从 节点 
P 到 达 节 点 + 时， 它 的 强度 比 在 节点 p 时 衰减 了 3 个 单 
位 ,但 是 ， 当 它 从 节点 + 流出 时 ， 又 恢复 了 它 在 源 点 p 
的 强度 。 因 此 ， 信 号 到 达 节 点 vv 时， 强度 比 在 源 点 p 图 11-12 树 形 分 布 网 络 
时 衰减 了 2 个 单位 ， 到 达 节 点 z 时 ， 强 度 比 在 源 点 p 
时 衰减 了 4 个 单位 。 如 果 在 节点 + 没有 信号 放大 器 ， 那 么 在 节点 z 的 信号 将 衰减 7 个 单位 。 

2. 求解 策略 

设 degradeFromParent(i) 表示 节点 i 与 其 父 节 点 间 的 衰减 量 。 因 此 ， 在 图 11-12 中 ， 
degradeFromParent(s)=2，degradeFromParent(p)=0，degradeFromParent(r)=3。 因 为 信号 放大 器 
只 能 放 在 树 形 分 布 网 的 节点 上 ， 所 以 节点 i 的 degradeFromParent(i) 如 果 大 于 容忍 值 ， 那 么 即 
使 在 节点 i 放置 了 信号 放大 器 ,信号 的 衰减 量 依然 要 超过 容忍 值 。 例 如 ， 若 容忍 值 为 2?， 则 在 
图 11-12 的 节点 + 上 即使 有 信号 放大 器 ， 信 号 的 衰减 量 也 不 会 小 于 或 等 于 2。 

在 以 节点 i 为 根 的 子 树 中 ， 从 节点 i 到 子 树 的 每 个 叶子 都 有 一 个 衰减 量 ， 我 们 把 这 些 衰 减 
量 的 最 大 者 记 为 degradeToLeaf(i)。 若 i 是 叶 节 点 ， 则 degradeToLeaf(i)=0。 在 图 11-12 中 ， 当 
i E {wx,1,y,z} 时 ，degradeToLeaf(i)=0。 对 于 其 他 节点 ，degradeToLeaf(i) 可 以 用 下 面 的 方程 
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式 来 计算 : 
degradeToLeaf(i)= smax 。 i degradeToLeaf(j )+degradeFromParent(7 )} 

因此 ，degradeToLeaf(s)=3。 在 此 公式 中 ， 要 计算 节点 的 degradeToLeaf 值 ， 就 要 先 计算 
其 子 节点 的 degradeToLeaf 值 ， 因 此 必须 对 树 进行 遍历 。 先 访问 子 节 点 再 访问 父 节 点 。 在 访问 
一 个 节点 时 ， 同 时 计算 它 的 degradeToLeaf 值 。 这 种 遍历 方法 是 对 后 序 遍 历 的 一 种 自然 扩充 ， 
其 树 的 度 大 于 2。 

按照 上 述 方法 ,在 计算 degradeToLeaf 过 程 中 ， 遇 到 一 节点 i， 它 有 一 子 节点 j 满足 

degradeToLeaf(j )+degradeFromParent(j)> 容忍 值 

如 果 不 在 j 节点 放置 放大 器 ， 那 么 从 i 节点 到 叶 节 点 的 信号 衰减 量 将 超过 容忍 值 ， 即 使 在 

i 节点 处 放置 了 放大 器 也 是 如 此 。 例 如 在 图 11-12 中 ， 当 计算 degradeToLeaf(g) 时 ， 有 
degradeToLeaf(s)+degradeFromParent(s)=5 

如 果 容 忍 值 为 3， 那 么 在 gq 点 或 其 祖先 的 任意 一 点 放置 放大 器 ， 都 不 能 减少 9 与 其 后 代 
间 的 衰减 量 。 我 们 需要 在 s 点 放 一 个 放大 器 ， 这 时 degradeToLeaf(q)=3。 

图 11-13 是 放置 放大 器 和 计算 degradeToLeaf 的 伪 码 。 


degradeToLeaf (i)=0; 


for(each child j of i) 
if(degradeToLeaf(j)+degradeFromParent(i))> 容忍 值 ) 
{ 
在 j 处 放 一 个 放大 器 ; 
degradeToLeafl(i}=max {degradeToLeaf(i)}, degradeFromParent(j)}; 
} 


élse 
degradeToLeaf(i)=max {degradeToLeaf(i)}, degradeToLeaf(j )}+degradeFromParent(ji ); 


11-13 放置 放大 器 和 计算 degradeToLeaf 的 伪 码 


把 图 11-13 的 计算 应 用 到 图 11-12 中 ,结果 是 在 节点 r+、s 和 v 处 放置 放大 器 ( 如 图 11-14 
所 示 )。 在 每 个 节点 内 是 degradeToLeaf 值 。 

定理 11-1 按 上 述 算法 所 放置 的 放大 器 最 少 。 

证 明 ”对 树 的 节点 数 n 进行 归纳 来 证 明 。 当 n=1 时 ,定理 显然 成 立 。 假 设 当 n < m 时 ， 
定理 成 立 ， 其 中 m 为 任意 的 自然 数 。 令 1 是 有 n+l 个 节点 的 树 。 令 是 按 上 述 算法 放置 放大 
器 的 节点 集合 ， 令 历 是 不 超过 容忍 值 且 拥有 放大 髓 最 少 的 节点 集合 。 需 证 司 =| 静 。 

车 到 =0， 则 国 =| 殉 。 者 四 >0， 则 令 了 是 按 上 述 
算法 给 出 的 第 一 个 放置 放大 器 的 节点 ， 令 坊 是 在 树 
中 以 z 为 根 的 子 树 。 因 为 degradeToLeafl(z)+degradeFr- 
omParent(z)> 容忍 值 ， 所 以 下 至 少 需 包含 i 的 某 个 节 
点 wu。 如 果 殉 还 包含 了 ud 以 外 的 元 素 ， 则 丈 一 定 不 
是 最 好 的 方案 ， 因 为 在 集合 W-{ 所 有 的 像 u 这样 的 
节点 }+ 人 2 中 放置 放大 器 也 能 满足 容忍 值 。 因 此 到 只 








包含 节点 ze 令 W=W-{u}, t' 是 从 树 1 中 除去 子 树 i 信号 放大 器 放置 在 阴影 节点 处 
(但 保留 z) 之 后 的 树 。 对 而 言 ，W' 是 满足 容忍 值 节点 中 的 数字 是 degradeToLeaf 的 值 


且 放 大 器 数目 最 少 的 方案 。 而 X=X-{z} 对 树 t' 也 满 图 11-14 带 有 放大 器 的 分 布 式 网 络 
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足 容 忍 值 ， 而 且 是 按 图 11-13 算法 得 到 的 。 因 为 1” 的 节点 数 小 于 m+1， 所 以 | 如 =| 丈 |。 因 此 
(A=|X|+1=|WI+1=| 瑰 |。 国 
3. C++ 实现 
当 分 布 树 没 有 节点 超过 两 个 孩子 时 ， 可 用 程序 11-9 的 类 linkedBinaryTree 表示 为 二 又 
树 ， 二 又 树 节点 的 数据 域 element 的 类 型 是 程序 11-12 的 结构 booster。 在 结构 booster 中 ， 域 
boosterHere 用 来 区 分 具有 放大 器 的 节点 和 没有 放大 器 的 节点 。 


程序 11-12 ”结构 booster 


struct booster 


{ 


int degradeToLeaf, 1/ 到 达 叶 子 时 的 衰减 量 
degradeFromParent; 1/ 从 父 节 点 出 发 的 衰减 量 
bool boosterHere; /1/ 当 且 仅 当 放置 了 放大 器 时 ， 值 为 真 


void output (ostream& out) const 
{out << boosterHere << ' ' << degradeToLeaf << ' ' 
<< degradeFromParent << ' ';]} 


区 


/ 重 载 操 作 符 << 
Ostream& operator<<(ostream& out, booster x) 
{x.output (eut) 7 return out;} 


通过 对 二 又 分 布 树 的 后 序 遍 历 ， 可 以 计算 节点 的 degradeToLeaf 值 ， 确 定 最 少 的 用 来 放置 
放大 器 的 节点 。 程序 11-13 的 函数 placeBoosters 用 于 访问 节点 ， 其 中 tolerance 是 表示 容忍 值 
的 全 局 变量 。 


程序 11-13 ”在 二 义 树 中 放置 放大 器 并 计算 degradeToLeaf 值 


void placeBoosters (binaryTreeNode<booster> *x) 


{1/ 计算 *x 的 衰减 量 ， 若 小 于 容忍 值 ， 则 在 x 的 子 节点 放置 一 个 放大 器 
X->element .degradeToLeaEf = 0; / 初始 化 x 处 的 衰减 


1/ 计算 x 的 左 子 树 的 衰减 量 。 若 大 于 容 巩 值 ， 则 在 x 的 左 孩 子 处 放置 一 个 放大 器 
binaryTreeNode<booster> *y = x->leftChild; 
if (y != NULL) 
{1/ x 有 一 棵 非 空 左 子 树 
int degradation = y->element.degradeToLeaf + 
y->element .degradeFromParent; 
if (degradation > tolerance) 
{1/ 在 y 处 放置 一 个 放大 器 
y->element.boosterHere = true; 
x->element.degradeToLeaf = y->element.degradeFromParent; 
} 
else // 不 需要 在 y 处 放置 放大 器 
x->element .degradeToLeaf = degradation; 
} 


1/ 计算 x 的 右 子 树 的 衰减 量 ， 若 大 于 容忍 值 ， 则 在 x 右 孩 子 处 放置 一 个 放大 器 
Y = x->rightCchild; 
if (y != NULL) 
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{1/x 有 一 标 非 空 右 子 树 
int degradation = y->element .degradeToLeaf + 
y->element .degradeFromParent; 
if (degradation > tolerance) 
{1/ 在 y 处 放置 一 个 放大 器 
y->element .boosterHere = true; 
degradation = y->element.degradeFromParent; 
} 
if (x->element.degradeToLeaf < degradation) 
x->element .degradeToLeaf = degradation; 


} 


如 果 t 是 类 linkedBinaryTree 的 对 象 ， 而 且 它 的 degradeFromParent 域 存储 衰减 值 ，boosterHere 
域 为 false， 那么 调用 t.postOrder(placeBoosters) 可 重新 为 degradeToLeaf 和 boosterHere 赋值 。 因 
为 placeBoosters 的 时 间 复 杂 性 为 6(1)， 所 以 调用 t.postOrder(placeBoosters) 所 花费 的 时 间 为 
O(n)， 其 中 为 树 的 节点 数 。 

4. 树 的 二 又 树 描述 

当 分布 树 :有 节点 超过 两 个 孩子 时 ,依然 用 二 又 树 来 表示 。 此 时 ， 对 每 个 节点 x， 可 用 其 
孩子 节点 的 rightChild 指针 把 x 的 所 有 孩子 链 成 一 条 链表 。x 节点 的 leftChild 指针 指向 该 链表 
的 第 一 个 节点 。x 节点 的 rightChild 指针 来 指向 x 的 兄弟 。 图 11-15 是 一 棵 树 和 其 二 又 树 ， 其 
中 实 线 表示 指向 左 孩子 的 指针 ， 虚 线 表 示 指 问 右 孩子 的 指针 。 





图 11-15 树 及 其 二 又 树 


当 一 棵 树 用 二 又 树 表示 时 ， 调 用 tpostOrder(placeBoosters) 不 会 产生 预期 的 结果 。 练 习 
57 要 求 设 计 函 数 ， 计 算 degradeToLeaf 和 boosterHere。 


11.9.2 ”并 查 集 


1. 问题 描述 

在 6.5.4 节 中 讨论 了 并 查 集 问题 。 有 个 元 素 从 1 到 nn 编 号 。 开 始 时 ， 每 一 个 元 素 
在 自己 的 类 中 ， 然 后 执行 一 系列 find 和 combine 操作。 操作 find(theElemenb 返回 元 素 
theElement 所 在 类 的 唯一 特征 ， 而 combine(a,b) 把 包含 a 和 bb 的 两 个 类 合并 。 在 6.5.4 节 ， 
combine(a,b) 是 用 合并 操作 unite(classA,classB) 来 完成 的 ， 其 中 classA=find(a), classB=find(b)， 
classA 关 classB。6.5.4 节 的 解决 方案 使 用 了 链表 ， 其 复杂 性 为 O(z+ylogx+ 思 ， 其 中 x 是 合并 
操作 的 次 数 ，f 是 查找 操作 的 次 数 。 本 节 将 采用 另 一 种 方案 来 解决 并 查 集 问题 ， 其 中 每 个 集合 
(类 ) 被 表示 为 一 棵 树 。 

2. 集合 的 树 形 描述 

任何 一 个 集合 8 都 可 以 描述 为 一 棵 具有 |$| 个 节点 的 树 ， 一 个 节点 代表 一 个 元 素 。 任 何 一 
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个 元 素 可 以 作为 根 元 素 ;剩余 元 素 的 任何 子 集 可 以 作为 根 元 素 的 孩子 ; 再 剩余 元 素 的 任何 子 
集 可 以 作为 根 元素 的 孙子 ， 等 等 。 

图 11-16 是 用 树 表示 的 一 些 集合 ， 其 中 每 个 非 根 节点 都 有 一 个 指针 指向 其 父 节 点 。 指 向 
父 节点 的 指针 之 所 以 需要 ， 是 因为 查找 操作 需要 向 上 搜索 一 棵 树 。 查 找 与 合并 操作 都 需要 向 
下 移动 。 

我 们 说 ， 元 素 1、2、20、30 等 属于 以 20 为 根 的 集合 ; 元 素 11、16、25、28 属于 以 16 
为 根 的 集合 ; 元 素 15 属于 以 15 为 根 的 集合 ; 元 素 26 和 32 属于 以 26 为 根 的 集合 (或 简单 说 
集合 26 )。 

3. 求解 策略 


并 查 集 问题 的 求解 策略 是 ， 把 每 一 个 £20) 人 
集合 表示 为 一 棵 树 。 在 查找 时 ， 我们 把 根 元 
素 作 为 集合 标志 符 。 因 此 ，find(3) 的 返回 值 Cs bs, 1 时 (9 (9 四 
是 20( 见 图 11-16 ); find(1) 的 返回 值 是 20; (1) (2) (3) (4) 
a) b) 


find(26) 的 返回 值 是 26。 因 为 每 一 个 集合 都 
有 唯一 的 根 ， 所 以 当 且 仅 当 1 和 j 属于 同一 


个 集合 时 ， 有 find(i)=find0)。 为 了 确定 元 G3) Co) 
素 theElement 属于 哪 一 个 集合 ， 我 们 从 元 素 G2) 
theElement 的 节点 开始 ， 沿 着 节点 到 其 父 节 夯 oD) 
点 向 上 移动 ， 直 到 根 节点 为 止 。 图 11-16 用 树 表 示 的 分 离 的 集合 


在 合并 时 ,我 们 假设 在 调用 语句 
unite(classA，classB) 中 ，classA 和 classB 


分 别 是 两 个 不 同 树 集合 的 根 ( 即 classA z 026 06) 

classB )。 为 了 把 两 个 集合 合并 ， 我 们 让 

一 棵 树 成 为 另 一 棵 树 的 子 树 。 人 例如， 假设 全 2) 2 加 四 二 

classA=16 而 classB=26 ( 见 图 11-16 )， 如 果 (Cu) (25) (28) 2) 
) b) 


让 classA 成 为 classB 的 子 树 ， 那 么 结果 如 


图 11-17a 所 示 ; 如 果 让 classB 成 为 classA 图 11-17 合并 
的 子 树 ， 那 么 结果 如 图 11-17b 所 示 。 
4. C++ 实现 


20 16 


并 查 集 问 题 的 求解 策略 是 模拟 指针 的 
一 个 极 好 的 应 用 。 这 里 需要 树 的 链表 描述 ， 。 6。 一。 ee 
其 中 每 个 节点 必须 有 一 个 parent 域 ， 但 不 
必 有 和 孩子 域 。 还 需要 直接 访问 节点 。 为 找 1 3 4 
到 含有 元 素 10 的 集合 ， 先 要 找到 元 素 10 (5) © 
的 节点 ， 然 后 沿 着 节点 的 parent 指针 找到 a) b) 
根 节点 。 如 果 n 个 节点 的 索引 号 从 1 到 n(n (0) Co 
是 元 素 个 数 )， 且 节点 e 表 示 元 素 e， 那 么 加 
很 容易 实现 直接 访问 。 每 个 parent 域 给 出 
父 节点 的 索引 ， 因 此 parent 域 为 整数 类 型 。 on 

图 11-18 就 是 采用 这 种 方法 来 表示 图 11-18 图 11-16 的 树 表示 
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图 11-16 的 。 节 点 内 的 数字 是 其 parent 域 的 值 ， 节 点 外 的 数字 是 该 节点 的 索引 。 索 引 同 时 也 
是 该 节点 所 表示 的 元 素 。 根 节点 的 parent 域 被 置 为 0。 因 为 没有 索引 是 0 的 节点 ， 所 以 parent 
为 0 表示 不 指向 任何 节点 〈 即 为 空 链 )。 

开始 时 ， 每 个 元 素 独 自 构 成 一 个 集合 ， 为 了 创建 这 个 初始 布局 ， 需 要 为 数组 parent 分 配 
空间 ， 并 置 数 组 et pe 为 0。 这 由 程序 11-14 的 initialize 函数 来 完成 。 


程序 11-14 ”基于 树 结构 的 并 查 集 问题 解决 方案 


void initialize(int numberOfElements) 

{/ 初始 化 numberOfElements 棵 树 ， 每 棵 树 一 个 元 素 
parent = new int[numberOfElements + 1]; 
for (int e = 1; e <= numberOfElements; e++) 

parent[e] = 0; 


} 


int findl(int theElement) 
{// 返回 元 素 theElement 所 在 树 的 根 
while (parent[theElement] != 0) 
theElement = parent[theElement]; // 向 上 移动 一 层 
return theElement; 


} 


void unite(int rootA, int rootB) 

{// 合并 两 棵 其 根 节 点 不 间 的 树 (rootA 和 rootB) 
Parent [rootB] = rootA; 

} 


为 查找 元 素 theElement 所 属 的 集合 ， 从 节点 theElement 出 发 ， 沿 着 parent 指针 搜索 至 
根 节 点 。 例 如 ， 如 果 theElement=4， 集合 状态 如 图 11-16a 所 示 ， 从 4 开始 。 由 指针 parent[4] 
到 达 节 点 8， 由 指针 parent[8] 到 达 节 点 20， 而 节点 parent[20]=0， 则 20 就 是 元 素 4 所 属 二 
又 树 的 根 。 程 序 11-14 的 函数 find 便 是 这 个 算法 ,而且 假 设 对 theElement 取 值 的 合法 性 检验 
1 丢 theElement 和 numberOfElements 在 函数 外 部 执行 。 

程序 11-14 的 函数 unite 实现 两 个 类 的 合并 。 假 设 对 条 件 rootA 关 rootB 的 检验 在 函数 外 
ee 总 是 把 rootB 作为 rootA 的 子 树 来 处 理 。 

生 能 分 析 

a 间 性 能 是 OnumberOfElements) ; 查找 函数 find 的 时 间 性 能 是 0(h)， 其 中 
h 是 树 的 高 度 。 合 并 函数 unite 的 时 间 性 能 是 6(1)。 

在 并 查 集 问题 的 典型 应 用 中 ， 要 执行 很 多 次 合并 和 查找 操作 。 而 一 个 操作 需要 多 少时 间 ， 
我 们 对 此 并 不 关心 ， 我 们 关心 的 是 整个 操作 需要 多 少时 间 。 假 设 一 个 系列 操作 要 执行 u 次 合 
并 和 了 次 查找 ， 因 为 每 次 合并 前 都 要 执行 两 次 查找 (这些 查找 决定 了 要 合并 的 树 的 根 )， 所 
以 可 假设 uw。 每 次 合并 所 需 时 间 为 @(1)。 每 次 查找 所 需 时 间 取 决 于 树 的 高 度 。 最 坏 情况 是 ， 
有 m 个 元 素 的 树 ， 其 高 度 为 m。 例 如 ， 下 面 的 操作 序列 可 导致 最 坏 情 况 ; 

unite(2,1), unite(3,2), unite(4,3), unite(5,4 )，… 

因此 ， 每 一 次 查找 时 间 多 则 为 9(q)， 其 中 g 是 执行 查找 之 前 的 合并 操作 次 数 。 于 是 ， 一 个 系 
列 操作 的 时 间 为 O00u)。 但 是 用 下 面 的 改进 方法 ， 这 个 时 间 可 以 降 到 O(f+u)=0(f)。 

6. 合并 函数 的 性 能 改进 

在 对 根 为 i 和 根 为 j 的 树 进行 合并 操作 时 ， 利 用 重量 规则 或 高 度 规则 ， 可 以 提高 并 查 集 算 
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法 的 性 能 。 . 

定义 11-3[ 重量 规则 ] 车 根 为 i 的 树 的 节点 数 少 于 根 为 j 的 树 的 节点 数 ， 则 将 作为 i 的 
父 节 上 点。 否则 ,将 i 作为 /的 父 节点 。 

定义 11-4[ 高 度 规则 ] 若 根 为 i 的 树 的 高 度 小 于 根 为 j 的 树 的 高 度 ， 则 将 j 作 为 i 的 父 节 
点 ， 否 则 ， 将 工作 为 了 的 父 节 点 

对 图 11-16a 和 图 11-16b 的 两 棵 树 进行 合 并 时 ， 无 论 采 用 重量 规则 还 是 高 度 规则 ， 都 会 把 
以 16 为 根 的 树 作为 子 树 ， 并 入 到 以 20 为 
根 的 树 中 。 但 是 对 图 11-19a 和 图 11-19b (20) (16) 
的 两 棵 树 进行 合并 时 ， 采 用 重量 规则 ， 将 


把 根 为 16 的 树 作为 子 树 ， 并 入 根 为 20 的 (5) Co (8) Co) 四 G5) (28) 
树 中 ， 而 采用 高 度 规则 ， 正 好 相反 。 @) (3) @) @@ © 


为 了 把 重量 规则 应 用 到 合并 算法 中 ， 
在 每 个 节点 增加 一 个 布尔 域 root。 当 且 仅 (26) 
当 一 个 节点 是 当前 根 节点 时 ， 它 的 root 域 a by) 
为 true。 每 个 根 节点 的 parent 域 用 来 记录 图 11-19 ”两 棵 树 
该 树 的 节点 总 数 。 对 于 图 11-16 的 树 ， 当 
且 仅 当 i=20、16、15 或 26 时 ，node[i].root=true ; 当 i=20、16、15 和 26 时 ，node[i]. parent 
分 别 为 9、4、1 和 2。 余下 节点 的 parent 域 不 变 。 
为 了 实现 重量 规则 ， 我们 定义 了 结构 unionFindNode， 它 是 树 节点 的 数据 类 型 。 程 序 
11-15 是 这 个 结构 的 代码 。 


程序 11-15 ”实现 重量 规则 时 使 用 的 结构 


struct unionFindNode 


{ 


int parent; /车 为 真 ， 则 表示 树 的 重量 ， 否 则 是 父 节点 的 指针 
bool root; 1/ 当 且 仅 当 是 根 时 ， 值 为 真 


unionFindNode () 
{parent = 1; root = 七 Yue7 } 
}; 


初始 化 、 查 找 和 合并 函数 采用 程序 11-16 的 形式 。 
虽然 合并 操作 的 时 间 有 所 增加 ， 但 仍 在 一 个 常数 范围 ， 即 @(1)。 引 理 11-1 给 出 了 进行 查 
找 所 需 时 间 的 最 大 值 。 


程序 11-16 ”用 重量 规则 进行 合并 
void initialize(int numberOofElements) 
{// 初始 化 numberOfElements 棵 树 ， 每 标 树 包含 一 个 元 素 
node = new unionFindNode [numberOfElements+1]; 
} 


int findl(int theElement) 
{/ 返回 元 素 所 在 树 的 根 
while (!node [theElerment] .root) 
theElement = node [theElement] .parent; // 向 上 移动 一 层 
return theElement; 
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} 


void unitel(int rootA, int rootB) 
{1/ 使 用 重量 规则 ， 合 并 其 根 不 同 的 树 (rootA 和 rootB) 
if (node[rootA] .parent < node [rootB] .parent) 
{/ 树 rootA 成 为 树 rootB 的 子 树 
node [rootB] .parent += node[rootA] .parent; 
node[rootA] .root = false; 
node[rootA] .parent = rootB; 
} 
else 
{// 树 rootB 成 为 树 rootA 的 子 树 
node[rootA] .parent += node [rootB] .parent;} 
node[rootB] .root = false; 
node[rootB] .parent = rootAa; 
} 
} 


引 理 11-1[ 重量 规则 引 理 ] 假设 从 单元 素 集合 出 发 ， 用 重量 规则 进行 合并 操作 ( 如 程序 
11-16 )。 若 以 此 方式 构建 一 棵 具有 成 个 节点 的 树 1:， 则 1 的 高 度 最 多 为 [logzp|+1 。 

证 明 当 p=1 时 引 理 显然 成 立 。 假设 当 i< p-l1 时， 对 所 有 具有 i 个 节点 的 树 ， 引 理 均 
成 立 。 下 面 将 证 明 i=p 时 引 理 也 成 立 。 考 虑 创建 树 1 的 最 后 一 次 合并 操作 unite(k])。 设 树 j 
的 节点 数 为 m， 树 的 节点 数 为 p-m。 不 失 一 般 性 ， 可 假设 1 < m < p/2。 于 是 ， 树 j 成 为 
树 大 的 子 树 。 树 1 的 高 度 要 么 与 的 高 度 相 同 ， 要么 比 j 的 高 度 大 1。 若 为 前 者 ， 则 1 的 高 
度 < llog:p-ml+1 < llogzpl+1。 若 后 者 为 真 ， 则 1 的 高 度 < [logsm|+2 < |logp/2]+2 < 
llogzp]+1。 图 

若 从 单元 素 集合 出 发 ， 混 合 执行 wx 次 合并 和 J 次 查找 序列 ， 则 每 个 集合 不 会 超过 w+l 个 
元 素 。 由 引 理 11-1 可 知 ， 若 使 用 重量 规则 ， 合 并 和 查找 序列 的 代价 〈 不 包括 初始 化 时 间 ) 为 
O(u+flogu)=O(flogu)( 因为 我 们 假定 户 u )。 

车 在 程序 11-16 中 采用 高 度 规则 而 非 重量 规则 ， 则 引 理 11-1 的 结论 依然 成 立 。 练 习 60、 
练习 61 和 练习 62 给 出 了 高 度 规则 的 具体 应 用 。 


7. 查找 函数 的 性 能 改进 C3) 

通过 修改 程序 11-14， 可 以 进一步 改进 查找 函数 在 最 坏 情 况 下 的 
性 能 ,方法 是 缩短 从 元 素 。 到 根 的 查找 路 径 。 这 个 方法 利用 了 路 径 压 “(3 ) (5) 
缩 ( path compression ) 过 程 ， 这 个 过 程 的 实现 至 少 有 3 种 不 同 的 途 
径 一 一 路 径 紧 缩 ( path compaction )、 路 径 分 割 (path splitting ) 和 路 © 性 党 


径 对 折 (path halving ) (20) No) (0) 


在 路 径 紧 缩 中 ， 从 待 查 节点 到 根 节点 的 路 径 上 ， 所 有 节点 的 
parent 指针 都 被 改 为 指向 根 节点 。 以 图 11-20 为 例 ， 当 执行 查找 操 (12) (3) 《4) 
作 find(10) 时 ， 从 10 到 根 的 路 径 有 节点 10、15 和 3。 把 这 些 节点 的 图 11-20 简单 树 
parent 域 改 为 2， 就 得 到 图 11-21 (节点 3 的 指针 本 来 就 指向 2， 因 此 | 
其 parent 域 不 必修 改 。 但 是 为 简化 起 见 ， 程 序 还 是 对 路 径 上 的 每 个 节点 都 进行 了 修改 )。 

虽然 路 径 紧缩 增加 了 单个 查找 操作 的 时 间 ， 但 它 减少 了 此 后 查找 操作 的 时 间 。 例 如 ， 在 
图 11-21 的 紧缩 路 径 中 查找 元 素 10 和 15 会 更 快 。 程 序 11-17 给 出 紧缩 规则 的 实现 。 
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图 11-21 路 径 紧缩 


程序 11-17 利用 路 径 紧缩 来 查找 一 个 元 素 
int findl(int theElement) 
{// 返回 元 素 theElement 所 在 树 的 根 
/1/ 紧缩 从 元 素 theElement 到 根 的 路 径 


/theRoot 最 终 是 树 的 根 

int theRoot = theElement; 

while (!node[theRoot] .root) 
theRoot = nodae [theRoot] .parent; 


1/ 紧缩 从 theElement 到 theRoot 的 路 径 
int currentNode = theElement; /从 theElement 开始 
while (人 (currentNode != theRoot) 
{ 
int parentNode = node[currentNode] .parent; 
node [currentNode] .parent = theRoot; 1/ 移 到 第 2 层 
currentNode = parentNode; 1/ 移 到 原来 的 父 节点 
} 


return theRoot; 
} 


在 路 径 分 割 中 ， 从 e 节 点 到 根 节点 的 路 径 上 ， 除 根 节点 和 其 子 节点 之 外 ， 每 个 节点 的 
parent 指针 都 被 改 为 指向 各 自 的 祖父 。 在 图 11-20 中 ， 路 径 分 割 从 节点 13 开始 ， 结 果 得 到 图 
11-22 的 树 。 在 路 径 分 割 时 ， 只 考虑 从 e 到 根 节点 的 一 条 路 径 就 够 了 。 

在 路 径 对 折 中 ， 从 e 节点 到 根 节点 的 路 径 上 ， 除 根 节点 和 其 子 节点 之 外 ， 每 隔 一 个 节点 ， 
其 parent 指针 都 被 改 为 指向 各 自 的 祖父 。 在 路 径 对 折 中 ， 指 针 改 变 的 个 数 仅 为 路 径 分 割 中 的 
一 半 。 同 样 ， 在 路 径 对 折 中 只 考虑 从 e 到 根 的 一 条 路 径 就 够 了 。 在 图 11-20 中 ， 路 径 对 折 从 
节点 13 开始 ， 结 果 得 到 图 11-23 的 树 。 





图 11-22 路径 分 割 图 11-23 ”路 径 对 折 


8. 合并 和 查找 函数 的 性 能 改进 

路 径 压 缩 过 程 可 以 改变 树 的 高 度 ， 但 不 能 改变 树 的 重量 。 但 是 通过 路 径 压 缩 来 确定 新 树 
的 高 度 是 很 麻烦 的 。 任 何 一 个 路 径 压缩 方法 和 重量 规则 一 起 使 用 都 是 相对 容易 的 ， 而 路 径 压 
缩 方法 和 高 度 规则 一 起 使 用 就 困难 了 。 然 而 我 们 可 以 修改 高 度 规则 ， 以 便 在 不 进行 路 径 压缩 
的 前 提 下 使 用 树 高 。 有 了 这 个 改进 ， 只 有 当 两 棵 高 度 相等 的 树 合并 时 ， 树 的 高 度 才 会 改变 。 

9. 改进 的 并 查 集 算法 在 最 坏 情况 下 的 性 能 

当 用 重量 规则 或 高 度 规则 进行 合并 操作 和 用 任何 一 个 路 径 压缩 方法 进行 查找 时 ， 执 行 系 
列 交错 的 合并 和 查找 操作 所 需 的 时 间 与 合并 和 查找 的 次 数 旺 线性 关系 。 不 仅 复杂 性 很 难 分 析 ， 
结果 也 不 易 说 明 。 

首先 要 定义 爆炸 式 增长 的 Ackermann 函数 4(i,j) 和 其 倒数 a(p,q) (增长 很 慢 ): 

2/ i=1Hj>1 
A(i,j) =1 A(i- 1,2) i>2Hj=1 
A(i-1,4A(i,j-1)) ij>2 
a(p,q) =min{z> 1|A(z,lp/9) > logzg},p >g>1 

练习 67 证 明 ， 函 数 4(i,) 是 i 和 j 的 增长 函数 ; 即 4(i,7)>4(i-1,7)，4(i,7)>4(i,j-1)。 实 际 
上 ， 函 数 4(i,j) 增长 很 快 。 结果， 它 的 反 函 数 a 随 着 p 和 9g 的 增长 而 缓慢 地 增长 。 

例 11-7 为 了 感受 一 下 Ackermann 函数 的 增长 有 多 快 ， 我 们 用 一 组 i 和 jj 的 值 来 计 
算 4(i,j)。 根 据 定义 ，4(2,1)=4(1,2)=2:=4。 对 j 宇 2，4(2,j)=4(1, 4(2,j-1))=24%?。 因 此， 
4(2,2)=2420=24=16; A(2,3)=242%2=21=65 536; 4(02,4)=2422=2534 (数值 太 大 ， 写 不 下 了 ); 和 

AQD)=2 
其 中 ， 在 等 式 右边 堆 上 去 的 2 有 .tl 个 。 当 六 3 时 ，4(2,)) 的 值 是 惊人 的 。 

A(3,1)=4(2,2)=16 不 是 一 个 惊人 的 数字 。 但 是 ，4(4,1)=4(3,2)=4(2, 4(3,1))=4(2,16)。 如 果 
4(2,4) 都 太 大 了 ， 那 么 4(4,1)=4(2,16) 呢 ? 

本 例 的 意图 不 是 要 你 牢记 4(i,j) 的 增长 有 多 快 ， 而 是 要 你 牢记 a(p,g) 的 增长 有 多 慢 。 当 
q=65 535=2™%-] 时 ，logg<16。 因 为 4(3,1)=16， 所 以 a(65 535,65 535)=3， 而 且 对 p 宇 65 535， 
有 a(p,65 535) 和 3。a(65 536,65 536)=4， 而 且 对 p 宇 65536， 有 a(p,65 536) 三 4。a(g,9) 直 
到 gq=24% 9 才 等 于 5， 而 2% 是 一 个 惊人 的 数字 。 因 此 ， 对 p 三 9，a(p,9) 直到 q=24%1 才 等 
下 5 

在 改进 的 并 查 集 算法 的 复杂 性 分 析 中 ，g 是 集合 的 元 素 个 数 ，p 是 查找 次 数 和 元 素 个 数 的 
和 。 因 此 ， 在 所 有 实际 应 用 而 言 ， 可 以 假设 a(p,q) < 4。 加 

定理 11-2[Tarjan 和 Van Leeuwen] 设 7T(u) 是 一 系列 交错 进行 的 次 查找 和 4 次 合并 
所 需 的 最 大 时 间 。 假 设 x 三 n/2， 其 中 是 元 素 个 数 ， 则 

ki(ntfa(f+n,n)) < TU < k(n+tfa(f+n,n)) 
其 中 ki 和 ks 为 正常 数 。 这 个 操作 序列 可 以 从 单元 素 集合 出 发 ， 采 用 重量 或 高 度 规则 进行 合 
并 ， 按 三 种 路 径 压 缩 方法 中 的 任何 一 种 进行 查找 。 

定理 11-2 中 的 要 求 u = n/2 并 不 是 非常 重要 。 因 为 当 w<n/2 时 ， 某 些 元 素 在 合并 操作 中 
并 未 涉及 。 我 们 在 合并 和 查找 操作 中 ， 并 不 考虑 单元 素 集 合 的 元 素 ， 因 为 对 这 些 元 素 的 每 一 
次 查找 可 在 O(1) 时 间 内 完成 。 尽 管 对 所 有 实际 应 用 ， 函 数 a(f+n,n) 大 4， 但 是 函数 增加 很 慢 ， 
而 且 合 并 和 查找 序列 的 复杂 性 与 元 素数 量 和 查找 次 数 不 是 线性 关系 。 
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我 们 有 2 种 方法 来 改进 合并 操作 的 性 能 ， 有 3 种 方法 改进 查找 操作 的 性 能 。 为 了 在 定理 


11-2 所 证 明 的 时 间 范 围 内 实现 一 个 解决 并 查 集 问题 的 程序 ， 我 们 有 6 种 选择 。 哪 一 种 选择 最 


好 ， 我 们 通过 实验 来 确定 。 

练习 

53. 有 一 个 分 布 网 络 是 一 棵 完全 二 又 树 ， 高 度 为 4， 节 点 序号 1 ~ 15， 如 图 11-6 所 示 ， 而且 
degradeFromParent(2:15)=[4,3,6,2,5,2,2,4,6,4,5,3,6,2]。 

1 ) 画 一 个 分 布 网 络 ， 每 一 条 边 用 相应 的 degradeFromParent 值 来 标志 ( 见 图 11-12 )。 

2 ) 在 分 布 树 中 ， 每 个 节点 用 它 的 degradeToLeaf 值 来 标志 。 

3 ) 用 11.9.1 节 的 方法 来 确定 ， 当 容忍 值 tolerance=8 时 ， 最 少 需要 多 少 信 和 号 放大 器 。 用 
图 11-14 的 方法 标志 每 一 个 节点 和 每 一 条 边 。 

54. 在 degradeFromParent(2:15)=[2,4,5,6,3,4,2,6,3,1,3,2,6,3] 和 容忍 值 tolerance=11 的 条 件 下 做 
练习 53。 

55. 1 ) 画 出 图 11-16a 和 图 11-16b， 图 11-17a 和 图 11-17b， 图 11-19a 和 图 11-19b 的 二 又 树 表示 。 
2 ) 画 出 图 11-12 的 二 叉 树 表示 。( 注意 这 类 树 的 二 又 树 描述 方法 与 用 左 孩 子 指针 指向 一 个 

节点 ， 右 孩子 指针 指向 另 一 个 节点 的 表示 方法 不 同 。) 

56. 森林 (forest ) 是 0 棵 或 多 棵 树 的 集合 。 在 树 的 二 又 树 表示 中 ， 根 没有 右 孩 子 。 由 此 可 以 
用 二 又 树 来 表示 具有 m 棵 树 的 森林 。 首 先 把 森林 的 每 棵 树 表 示 为 二 义 树 ， 然 后 ， 把 第 i 
棵 作为 第 六 1 棵 树 的 右 子 树 ， 其 中 2 < i=< m。 画 出 图 11-16 森林 的 二 叉 树 表示 ， 还 有 
图 11-17 和 图 11-19 的 二 棵 树 表示 。 

57. 设 t 为 类 linkedBinaryTree 的 一 个 实例 。 假 设 t 为 分 布 树 ( 如 图 11-15 所 示 ) 的 二 又 树 表 
示 。 编 写 一 个 程序 ， 对 于 计算 t 的 每 个 节点 ,计算 其 degradeToLeaf 和 boosterHere 的 值 。 
程序 应 调用 t.postOrderOutput() 来 输出 结果 。 用 适当 的 分 布 树 来 检查 程序 的 正确 性 。 

58. 设 有 n 个 集合 ， 每 个 集合 的 元 素 各 不 相同 : 

1 ) 证 明 若 执行 wx 次 合并 操作 ， 则 所 有 集合 的 元 素数 不 大 于 x+1。 

2 ) 证 明 在 集合 数目 变 成 1 之 前 ， 最 多 执行 了 n-1 次 合并 操作 。 

3 ) 证 明 若 执行 的 合并 次 数 小 于 rn/21 ， 则 至 少 有 一 个 单元 素 集合 。 

4 ) 证 明 若 执行 了 zx 次 合并 操作 ， 则 单元 素 集合 至 少 有 max{ma-2x，0} 个 。 

59. 给 出 一 个 例子 ， 从 单元 素 集合 开始 ， 执 行 一 系列 合并 操作 ， 使 生成 树 的 高 度 等 于 引 理 11-1 
给 出 的 上 限 。 假 设 每 次 合并 都 遵循 重量 规则 。 

60. 给 出 程序 11-14 关于 合并 函数 的 另 一 个 版 本 ， 采 用 高 度 规则 而 不 是 重量 规则 。 

61. 当 采 用 高 度 规则 而 非 重量 规则 时 证 明 引 理 11-1。 

62. 给 出 一 个 例子 ， 由 单元 素 集 合 开始 执行 一 系列 合并 操作 ， 使 生成 树 的 高 度 等 于 引 理 11-1 
给 出 的 上 限 。 假 设 每 次 合并 都 遵循 高 度 规则 。 

63. 一 个 是 程序 11-14 的 简单 合并 / 查找 算法 ， 男 一 个 是 使 用 重量 规则 和 路 径 压 缩 的 合并 / 查 


找 (程序 11-16 和 程序 11-17 )， 比 较 这 两 个 方法 的 平均 性 能 。 取 的 不 同 值 来 进行 这 种 比 
较 。 对 每 个 n 值 ， 生 成 一 随机 序 偶 (i,7)。 用 两 个 查找 操作 替换 这 个 序 偶 ( 其 中 一 个 查找 i 
另 一 个 查找 7] )。 若 这 两 个 元 素 在 不 同 集合 中 ， 则 执行 一 次 合并 操作 。 使 用 多 个 不 同 的 随机 
序 偶 重复 进行 实验 。 测 试 所 有 操作 所 需 的 总 时 间 。 自 己 描述 基本 实验 内 容 ， 设 计 一 个 有 意 
义 的 实验 ， 比 较 两 组 程序 的 平均 性 能 。 写 出 关于 实验 过 程 和 结果 的 报告 ， 其 中 包括 程序 、 
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平均 时 间 表 和 图 。 
64. 编写 find 函数 ， 采 用 路 径 分 割 而 不 是 程序 11-17 所 使 用 的 路 径 紧缩 方法 。 
65. 编写 find 函数 ， 采 用 路 径 对 折 而 不 是 程序 11-17 所 使 用 的 路 径 紧缩 方法 。 
66. 设计 6 个 方法 ， 每 个 方法 都 可 以 得 到 定理 11-2 给 出 的 性 能 。 用 实验 来 评价 这 6 个 方法 ， 
确定 哪 一 个 最 好 。 
67. 证 明 
1 ) 对 i>l1 和 jj 三 1， 有 4(i,))>4(i-1,)) 
2) 对 i 三 1 和 户 1， 有 4(i))>4(i,j-1) 
3) 对 r>p 二 gq 二 1, a(xgq) 三 a(p,qg)。 


11.10 ”参考 及 推荐 读物 


关于 二 叉 树 问题 ， 有 一 本 好 的 参考 书 : D Knuth. The Art of Computer Programming: 
Fundamental Algorithms, Volumel, 3rd ed. Addison-Wesley.Reading, MA, 1997. 关于 放大 器 放置 问 
题 ， 在 下 面 的 论文 中 有 深入 研究 : D. Paik, S. Reddy, S. Sahni. Deleting Vertices in Dags to Bound 
Path Lengths. IEEE Transactions on Computers, 43, 9, 1994, 1091~1096. 还 有 D. Paik, S. Reddy, S. 
Sahni. Heuristics for the Placement of Flip-Flops in Partial Scan Designs and for the Placement of 
Signal Boosters in Lossy Circuits. Sixth International Conference On VLSI Design,1993 ,45~50. 

关于 在 线 等 价 类 问题 的 树 形 描述 ， 在 下 面 论文 中 有 完整 的 分 析 : R. Tarjan, J. Leeuwen. 
Worst Case Analysis of Set Union Algorithms. Journal of the ACM, 31, 2, 1984, 245~281. 

本 书 网 站 还 有 一 些 本 教材 没有 包含 的 树 结构 : 配对 堆 (pairing heap )、 区 间 堆 (interval 
heap )、 双 端 优先 级 队列 的 树 结构 (tree structures for double-ended priority queue )、 字 上 典 树 
(tries， 也 称 前 缀 树 、 单 词 查找 树 、 键 树 )、 后 缀 树 ( suffix tree )。 应 该 在 学 习 了 第 12 ~ 15 章 
之 后 阅读 这 些 内 容 。 
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Data Structures, Algorithms, and Applications in C++, Second Edition 


优先 级 队列 





概述 


与 第 9 章 的 FIFO 结构 的 队列 不 同 ， 在 优先 级 队列 中 ， 元素 出 队列 的 顺序 由 元 素 的 优先 
级 决定 。 可 以 按 优先 级 的 递增 顺序 ， 也 可 以 按 优先 级 的 递减 顺序 ， 但 不 是 元 素 进 入 队列 的 
顺序 。 

堆 是 实现 优先 级 队列 效率 很 高 的 数据 结构 。 堆 是 一 棵 完全 二 又 树 ， 用 11.4.1 节 的 数组 表 
示 最 有 效率 。 在 链表 结构 中 ， 在 高 度 和 重量 上 的 左 高 树 也 适合 于 表示 优先 级 队列 。 本 章 的 内 
容 涵 盖 了 堆 和 左 高 树 。 另 外 的 优先 级 队列 数据 结构 一 一 配对 堆 一 一 在 本 书 的 网 站 上 。 在 本 书 
的 网 站 上 还 有 双 端 优先 级 队列 结构 ， 它 既 可 以 按照 优先 级 的 递增 顺序 删除 ， 也 可 以 按照 优先 
级 的 递减 顺序 删除 。C++ 的 STL 类 priority-queue 是 用 堆 实 现 的 优先 级 队列 。 

在 本 章 后 面 的 应 用 部 分 ， 我 们 利用 堆 开 发 了 一 种 复杂 性 为 O(nlogn) 的 排序 算法 ， 称 为 堆 
排序 。 第 2 章 中 介绍 的 地 个 元 素 的 排序 算法 ， 其 时 间 复 杂 性 均 为 O(n”)。 尽 管 在 第 6 章 所 介绍 
的 箱子 排序 和 基数 排序 算法 便 时 间 复 杂 性 降 到 8(n)， 但 是 算法 要 求 元 素 的 取 值 必须 在 合适 的 
范围 内 。 迄 今 为 止 ， 堆 排序 是 第 一 种 通用 排序 算法 ， 且 时 间 复 杂 性 优 于 O025)。 第 18 章 将 讨 
论 另 一 种 与 堆 排序 具有 相同 复杂 性 的 排序 算法 。 从 谣 近 复杂 性 的 观点 来 看 ， 堆 排序 是 一 种 优 
化 的 排序 算法 ， 因 为 可 以 证 明 ， 任 何 依赖 成 对 元 素 比 较 的 通用 排序 算法 都 具备 Q(nlogn) 时 间 
复杂 性 〔( 见 18.4.2 节 )。 

本 节 所 考察 的 另外 两 个 应 用 是 机 器 调度 和 霍 夫 曼 编码 。 机 器 调度 问题 属于 NP- 复杂 类 问 
题 ， 对 于 这 类 问题 ， 不 存在 具有 多 项 式 时 间 复 杂 性 的 算法 。 而 如 第 3 章 所 述 ， 对 于 大 量 的 算 
法 ， 只 有 具备 多 项 式 时 间 复 杂 性 才 是 可 行 的 。 因 此 ， 对 NP- 复杂 问题 ， 经 常 利用 近似 算法 或 
启发 式 算法 来 解决 ， 这 些 算法 能 在 合理 的 时 间 内 完成 ， 但 不 能 保证 有 最 佳 的 结果 。 而 堆 数 据 
结构 用 来 实现 一 个 成 熟 的 机 器 调度 问题 的 近似 算法 是 很 有 效 的 。 





12.1 定义 和 应 用 


优先 级 队列 ( priority queue ) 是 0 个 或 多 个 元 素 的 集合 ， 每 个 元 素 都 有 一 个 优先 权 或 值 ， 
对 优先 级 队列 执行 的 操作 有 1 ) 查找 一 个 元 素 ; 2 ) 插入 一 个 新 元 素 ; 3 ) 删除 一 个 元 素 。 与 这 
些 操作 分 别 对 应 的 函数 是 top、push 和 pop。 在 最 小 优先 级 队列 (min priority queue ) 中 ， 查 
找 和 删除 的 元 素 都 是 优先 级 最 小 的 元 素 ; 在 最 大 优先 级 队列 ( max priority queue ) 中 ， 查 找 和 
删除 的 元 素 都 是 优先 级 最 大 的 元 素 。 优 先 级 队列 的 元 素 可 以 有 相同 的 优先 级 ， 对 这 样 的 元 素 ， 
查找 与 删除 可 以 按 任意 顺序 处 理 。 

例 12-1 假设 我 们 对 一 台 机 器 所 提供 的 服务 按 固定 时 间 收 费 ( 如 ， 按 天 或 按 月 )。 每 个 
用 户 的 付费 是 相同 的 ， 但 每 个 用 户 每 次 使 用 机 器 的 时 间 是 不 同 的 。 假 设 机 器 在 任何 时 候 都 可 
以 服务 ， 为 了 取得 最 大 的 收益 ， 我 们 把 等 待机 器 服务 的 用 户 组 成 一 个 最 小 优先 级 队列 。 优 先 
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级 是 用 户 所 需 的 服务 时 间 。 当 一 个 用 户 需要 机 器 服务 时 ， 他 的 请 求 就 被 加 入 优先 级 队列 。 一 
且 机 器 空闲， 服务 时 间 需 求 最 少 〈 即 优先 级 最 大 ) 的 用 户 便 最 先 得 到 服务 。 

如 果 每 个 用 户 所 需 的 机 器 服务 时 间 相 同 ,但 是 愿意 支付 的 费用 不 同 ， 那 么 ， 可 以 用 支付 
费用 作为 优先 级 ， 组 成 最 大 优先 级 队列 。 一 旦 机 器 空 丫 ， 付 费 最 多 的 用 户 最 先 得 到 服务 。 ”四 

例 12-2[ 事件 表 ] 在 9.5.4 节 介 绍 了 工厂 仿真 问题 。 对 事件 队列 所 执行 的 操作 有 : 1 ) 查 
找 具 有 最 小 完成 时 间 的 机 器 ; 2 ) 改变 该 机 器 的 完成 时 间 。 假 定 我 们 构造 一 个 最 小 优先 级 队 
列 ， 队 列 的 元 素 代 表 机 器 ， 元 素 的 优先 级 是 机 器 的 完成 时 间 。 在 最 小 优先 级 队列 中 ，top 函 
数 的 返回 值 是 具有 最 小 完成 时 间 的 机 器 。 为 了 修改 该 机 器 的 完成 时 间 ， 要 先 执行 取 元 素 操 
作 top， 再 执行 删除 元 素 操 作 pop， 然 后 对 删除 的 元 素 修 改 其 完成 时 间 之 后 ， 执 行 插入 操作 
push， 将 其 插入 队列 。 实 际 上 ， 对 事件 表 的 应 用 ， 应 该 在 优先 级 队列 中 增加 一 个 操作 ， 用 来 
修改 首 元 素 的 优先 级 。 这 个 操作 把 修改 一 台 机 器 的 完成 时 间 所 需要 的 三 步 操作 ( top、pop 和 
push ) 并 为 一 个 操作 。 

对 于 工厂 仿真 问题 ， 也 可 用 最 大 优先 级 队列 来 处 理 。 在 9.5.4 节 的 仿真 程序 中 ， 每 台 机 器 
按 先进 先 出 的 方式 来 执行 一 组 等 待 服务 的 任务 。 因 此 ， 可 为 每 台 机 器 配置 一 个 FIFO 队列 。 如 
果 服 务 规则 改 为 “一 旦 机 器 可 用 ， 便 从 等 待 任务 中 选择 优先 级 最 大 的 任务 进行 处 理 "， 那 么 每 
台 机 器 就 需要 一 个 最 大 优先 级 队列 。 每 台 机 器 执行 的 操作 有 : 1 ) 每 当 一 个 新 任务 到 达 ， 将 其 
插入 该 机 器 的 最 大 优先 级 队列 ; 2 ) 一 旦 机 器 可 以 执行 一 个 新 任务 ， 便 将 优先 级 最 大 的 任务 从 
该 队列 中 删除 ， 并 开始 执行 。 

当 每 个 机 器 的 服务 规则 如 上 述 改变 之 后 ，9.5.4 节 的 仿真 问题 需要 为 事件 表 配 备 一 个 最 小 
优先 级 队列 ， 在 每 台 机 器 配备 一 个 最 大 优先 级 队列 。 国 

本 章 开 发 了 优先 级 队列 的 有 效 表 示 法 。 鉴 于 最 大 优先 级 队列 与 最 小 优先 级 队列 十 分 类 似 ， 
故 只 开发 了 最 大 优先 级 队列 。 


12.2 ”抽象 数据 类 型 


最 大 优先 级 队列 的 抽象 数据 类 型 说 明 如 ADT 12-1 所 示 ， 最 小 优先 级 队列 的 抽象 数据 类 
型 说 明 与 之 类 似 ， 只 是 top 的 pop 函数 不 同 ， 查 找 和 删除 的 都 是 优先 级 最 小 的 元 素 。 


抽象 数据 类 型 maxPriorityQueue 
{ 
实例 
有 限 个 元 素 集合 ， 每 一 个 元 素 都 有 优先 级 





操作 


empty(): 返回 值 为 tue， 当 且 仅 当 队 列 为 空 
size(): 返回 队列 的 元 素 个 数 
top(): 返回 优先 级 最 大 的 元 素 
Pop0: 删除 优先 级 最 大 的 元 素 
Push(x): 插 人 元 素 x 





ADT 12-1 最 大 优先 级 队列 的 抽象 数据 类 型 说 明 


程序 12-1 是 表示 抽象 数据 类 型 maxPriorityQueue 的 C++ 抽象 数据 类 。 假 设 当 两 个 类 型 为 
T 的 元 素 通过 操作 符 < 和 <= 进行 比较 时 ， 比 较 的 是 元 素 的 优先 级 。 
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程序 12-1 抽象 类 maxPriorityQueue 


template<class T> 
class maxPriorityQueue 
{ 
Bublic: 
virtual ~maxPriorityQueue() {} 
virtual bool empty() const = 0; : 
/返回 true， 当 且 仅 当 队 列 为 空 
Virtual int size() const = 0; 
/返回 队列 的 元 素 个 数 
virtual const 7T& top() = 0; 
/返回 优先 级 最 大 的 元 素 的 引用 
virtual void pop() = 0; 
// 删除 队 首 元 素 
virtual void Push (const T& theElement) = 0; 
1/ 插入 元 素 theElement 





12.3 ”线性 表 


描述 最 大 优先 级 队列 最 简单 的 方法 是 无 序 线性 表 。 假 定 一 个 优先 级 队列 具有 nn 个 元 素 。 
利用 公式 (5-1 ) 把 一 个 新 元 素 搬入 表 的 右 端 很 容易 ， 而 且 插入 所 需 时 间 为 6(1)。 但 在 执行 删 
除 操作 时 ， 必 须 先 在 未 排序 的 n 个 元 素 中 查找 优先 级 最 大 的 元 素 ， 然 后 执行 删除 。 因 此 删除 
操作 所 需 时 间 为 9(n)。 如 果 利 用 链表 ， 插 入 操作 在 链 头 执行 ， 时 间 为 9(1)， 而 删除 操作 所 需 
时 间 为 @(n)。 

另 一 种 表示 方法 是 有 序 线性 表 ， 当 使 用 公式 (5-1 ) 时 ， 元素 按 非 递减 顺序 排列 ， 当 使 用 链表 
时 ， 则 按 非 递增 次 序 排列 。 这 两 种 描述 方法 的 删除 时 间 均 为 6(1)， 插 入 操作 所 需 时 间 均 为 @(n)。 


练习 


1. 利用 数组 线性 表 ( 见 5.3 节 ) 设计 C++ 类， 实现 抽象 数据 类 型 maxPriorityQueue。push 的 
时 间 应 为 9(1)，top 和 pop 的 时 间 应 为 O(n)， 其 中 是 元 素 个 数 。 

2. 利用 6.1 节 的 链表 类 chain 重 做 练习 1。 

3. 利用 有 序数 组 线性 表 重 做 练习 1， 函 数 push 的 时 间 应 为 O(n)，top 和 pop 的 时 间 应 为 @(1)。 

4. 利用 有 序 链 表 重 做 练习 1。 函 数 push 的 时 间 应 为 O(n)， 而 top 和 pop 的 时 间 应 为 6(1)。 

5. 假设 优先 级 是 一 个 整数 ， 范 围 从 1 到 maxPriority， 其 中 maxPriority 是 一 个 比较 小 的 党 
数 ， 例 如 3 或 4。 设 计 一 个 C++ 类 ， 用 FIFO 队列 数组 priority[] 实现 最 大 优先 级 队列 ; 
priority[i] 存储 所 有 优先 级 为 i 的 元 素 。 假 设 一 个 元 素 的 优先 级 可 以 通过 强制 转换 ， 把 元 素 
转换 为 整 型 而 确定 。 类 的 构造 函数 要 求 指定 maxPriority 的 值 ， 每 一 个 操作 的 时 间 复 杂 性 应 
该 是 6(1) (不 包括 数组 空间 扩充 所 需要 的 时 间 )。 测 试 你 的 代码 。 


12.4 堆 


12.4.1 定义 
定义 12-1 一 棵 大 根 树 ( 小 根 树 ) 是 这 样 一 棵 树 ， 其 中 每 个 节点 的 值 都 大 于 (小 于 ) 
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或 等 于 其 子 节 点 (如果 有 子 节点 的 话 ) 的 值 。 
图 12-1 是 一 些 大 根 树 ( max tree )， 图 12-2 是 一 些小 根 树 ( min tree )。 虽 然 这 些 树 都 是 二 
叉 树 ， 但 不 是 必要 的 。 在 大 根 树 或 小 根 树 中 ， 节 点 的 子 节点 个 数 可 以 任意 。 


图 12-1 大 根 树 
(2) (10) 
和 4 (20) 四 
Go) (8) (©) (0) 
a) b) c) 
图 12-2 小 根 树 


定义 12-2 一 个 大 根 堆 ( 小 根 堆 ) 既是 大 根 树 ( 小 根 树 ) 也 是 完全 二 又 树 。 

图 12-1b 的 大 根 树 并 不 是 大 根 堆 ， 因 为 它 不 是 完全 二 又 树 ， 图 12-1 的 另外 两 棵 大 根 树 
是 完全 二 又 树 ， 因 此 是 大 根 堆 。 图 12-2b 的 小 根 树 不 是 小 根 堆 ， 因 为 它 不 是 完全 二 又 树 。 图 
12-2 另外 两 棵 小 根 树 是 完全 二 又 树 ， 因 此 是 小 根 堆 。 | 

因为 堆 是 完全 二 叉 树 ， 所 以 用 11.4.1 节 的 一 维 数组 有 效 地 描述 。 利 用 二 叉 树 的 特性 11-4， 
可 以 将 堆 中 节点 移 到 它 的 父 节点 或 它 的 一 个 子 节点 处 。 在 后 面 的 讨论 中 ,我 们 将 用 节点 在 数 
组 描述 中 的 位 置 来 表示 它 在 堆 中 的 位 置 ， 如 根 的 位 置 为 1， 其 左 孩 子 为 2， 右 孩子 为 3， 等 
等 。 另 外 ， 堆 是 完全 二 又 树 ， 具 有 n 个 元 素 的 堆 的 高 度 为 [log,(n+1)|。 因 此 ， 如 果 能 够 在 
O(height) 时 间 内 完成 插入 和 删除 操作 ， 那 么 这 些 操作 的 复杂 性 为 O(logn)。 


12.4.2 ”大根 堆 的 插入 


12-3a 是 一 棵 5 元素 的 大 根 堆 。 因 为 堆 是 完全 二 义 树 ， 所 以 当 加 入 一 个 元 素 形成 6 元 
素 堆 时 ， 其 结构 必然 如 图 12-3b 所 示 。 揪 人 过 程 是 这 样 的 ， 把 新 元 素 插 和 人 新 节点 ， 然 后 沿 着 
从 新 节点 到 根 节点 的 路 径 ， 执 行 一 趟 起 泡 操 作 ， 将 新 元 素 与 其 父 节 点 的 元 素 比 较 交 换 ， 直 到 
后 者 大 于 或 等 于 前 者 为 止 。 

如 果 插 入 的 元 素 是 1， 则 插入 后 该 元 素 成 为 2 的 左 孩子 。 如 果 插 和 人 的 新 元 素 不 是 1， 而 
是 5， 则 该 元 素 不 能 成 为 2 的 左 孩 子 ， 否 则 将 改变 大 根 树 的 特性 。 这 时 应 把 元 素 2 下 移 到 其 
左 孩 子 节点 〈 如 图 12-3c 所 示 )， 或 者 说 ， 把 元 素 5 上 升 到 父 节 点 ， 即 元 素 2 原来 的 位 置 ， 
然后 确定 这 时 的 二 叉 树 是 否 是 大 根 堆 。 由 于 父 节点 的 元 素 20 不 小 于 新 元 素 5， 所 以 可 以 把 新 
元 素 5 插 到 如 图 12-3c 所 示 的 位 置 上 。 如 果 插 人 的 新 元 素 不 是 5， 而 是 21， 这 时 ， 元 素 2 下 
移 到 其 左 子 节点 ， 如 图 12-3c 所 示 。 但 是 21 不 能 插入 原来 2 所 在 的 位 置 ， 因 为 这 个 位 置 上 
的 父 节 点 元 素 20 小 于 新 元 素 21。 因 此 把 20 移 到 它 的 右 子 节 点 ,把 21 插入 堆 的 根 节点 ( 如 
12-3d 所 示 )。 
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s 5 20) 


d) 





图 12-3 大 根 堆 的 插入 


上 述 的 插入 策略 是 从 一 个 叶子 到 根 的 一 趟 起 泡 过 程 。 每 一 层 的 操作 需 耗 时 6(1)， 因 此 ， 
实现 这 种 插入 策略 的 时 间 复 杂 性 为 O(height)=O(logn)。 


12.4.3 ”大根 堆 的 删除 


在 大 根 堆 中 删除 一 个 元 素 ， 就 是 删除 根 节点 的 元 素 。 例 如 ,在 图 12-3d 的 大 根 堆 中 进行 
一 次 删除 操作 ， 就 是 删除 元 素 21。 删 除 之 后 ， 大 根 堆 只 剩 下 5 个 元 素 。 此 时 的 二 又 树 需 要 重 
新 组 织 ， 以 便 仍 是 大 根 堆 ( 既 重 构 ， 以 对 应 一 棵 完全 二 叉 树 ， 它 是 5 个 元 素 的 最 小 树 )。 为 
此 ， 把 位 置 6 的 元 素 2 取出， 然后 删除 原来 2 所 在 的 节点 ， 这 样 就 得 到 了 一 个 完全 二 叉 树 结 
构 (如 图 12-4a 所 示 )。 但 此 时 的 根 节点 为 空 ， 而 元 素 2 还 不 在 堆 结构 中 。 如 果 把 2 直接 插入 
根 节点 ,那么 结果 不 是 大 根 树 。 现 在 需要 把 根 节点 的 左右 孩子 元 素 的 大 者 ， 即 20， 移 到 根 节 
点 ， 结 果 位 置 3 成 为 一 个 空位 。 因 为 3 这 个 位 置 没 有 孩子 节点 ， 所 以 可 以 把 2 插入 这 个 位 置 。 
结果 形成 大 根 堆 ， 如 图 12-3a 所 示 。 

现在 假设 要 删除 20。 删 除 之 后 ， 堆 的 二 叉 树 结构 如 图 12-4b 所 示 。 为 得 到 这 个 结构 ， 把 
元 素 10 从 位 置 5 移 出， 删除 位 置 5。 如 果 将 10 放 在 根 节 点 ， 结 果 并 不 是 大 根 堆 。 现 在 需 
要 把 根 节 点 的 两 个 孩子 元 素 (15 和 2 ) 的 大 者 ， 即 15， 移 到 根 节 点 。 这 时 位 置 2 是 一 个 空 
位 ， 但 是 还 不 能 将 10 揪 到 这 个 位 置 ， 因 为 结果 不 是 大 根 堆 。 再 将 这 个 位 置 的 左右 孩子 元 素 
的 大 者 ， 即 14， 移 到 这 个 位 置 ， 腾 空位 置 4。 然 后 把 10 插入 位 置 4。 最 后 结果 是 大 根 堆 ， 如 
图 12-4c 所 示 。 


by) 人 
图 12-4 ”从 大 根 堆 删除 最 大 元 素 


删除 策略 形成 一 条 从 根 节 点 到 一 个 叶 节点 的 路 径 。 每 一 层 的 操作 需 耗 时 @(1)， 因 此 ， 实 
现 这 种 删除 策略 的 时 间 复 杂 性 为 O(height)=O(logn)。 


12.4.4 大根 堆 的 初始 化 


在 大 根 堆 的 若干 种 应 用 中 ,包括 例 12-2 的 工厂 仿真 问题 的 事件 表 ， 开 始 时 ， 堆 已 经 含有 
n(n>0) 个 元 素 。 为 了 构建 这 个 初始 的 非 空 堆 ， 我 们 需要 在 空 堆 中 执行 ”次 插 人 操作 。 插 和 人 操 
作 所 需 的 总 时 间 为 O(nlogn)。 也 可 以 用 不 同 的 策略 在 @(n) 时 间 内 完成 堆 的 初始 化 。 
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假设 数组 a 在 开始 时 有 nn 个 元 素 。 假 设 n=10， 在 a[1:10] 中 ， 元 素 的 优先 级 为 [20，12， 
35，15，10，80，30，17，2，1]。 这 个 数组 可 以 用 来 表示 图 12-5a 的 完全 二 义 树 。 但 是 这 棵 
完全 二 叉 树 不 是 大 根 堆 。 

为 了 将 图 12-5a 的 完全 二 叉 树 转化 为 大 根 堆 ， 从 最 后 一 个 具有 和 孩子 的 节点 ( 即 元 素 10 的 
节点 ) 开始 检查 。 这 个 元 素 在 数组 中 的 位 置 为 ;=|mw2|。 如 果 以 这 个 元 素 为 根 的 子 树 是 大 根 
堆 ， 则 不 做 操作 。 如 果 以 这 个 元 素 为 根 的 子 树 不 是 大 根 堆 ， 则 必须 把 这 个 子 树 调整 为 大 根 堆 。 
然后 继续 检查 以 i-1、i-2 等 节点 为 根 的 子 树 ， 直 至 检查 到 以 1 为 根 的 树 为 止 。 

下 面 对 图 12-5a 的 二 叉 树 实施 这 一 过 程 。 最 初 ，i=5。 以 位 置 5 为 根 的 子 树 已 是 大 根 堆 ， 
因为 10>1。 下 一 步 i=4， 检 查 以 位 置 4 为 根 的 子 树 。 由 于 15<17， 所 以 它 不 是 大 根 堆 。 为 将 
其 调整 为 大 根 堆 ， 将 15 与 17 交换 ， 得 到 如 图 12-5b 所 示 的 大 根 堆 。 人 然后 i=3， 检 查 以 位 置 3 
为 根 的 子 树 。 它 不 是 大 根 堆 。 为 使 其 变 为 大 根 堆 ， 将 80 与 35 交换 。 接 下 来 =2， 检查 以 位 
置 2 为 根 的 子 树 ， 它 不 是 大 根 堆 。 将 该 子 树 重 构 为 大 根 堆 需要 确定 较 大 的 孩子 ， 即 17。 因 为 
12<17， 所 以 12 与 17 交换 ，17 成 为 重 构 子 树 的 根 。 下 一 步 将 12 与 位 置 4 的 两 个 孩子 的 较 大 
一 个 进行 比较 ， 由 于 12<15， 所 以 15 被 移 到 位 置 4。 这 时 位 置 8 没有 孩子 ， 将 12 插入 这 个 位 
置 ， 形 成 图 12-5c。 最 后 ，i=1， 检 查 以 位 置 1 为 根 的 树 。 这 时 以 位 置 2 或 位 置 3 为 根 的 子 树 
已 是 大 根 堆 了 ， 然 而 20<max{17，80}， 因 此 20 与 80 交换 ，80 成 为 大 根 堆 的 根 。 这 时 位 置 3 
空 出 。 因 为 20<max{35,30}， 把 35 移 到 位 置 3。 最 后 20 占据 位 置 6。 图 12-5d 显示 了 最 终 形 
成 的 大 根 堆 。 





图 12-5 大 根 堆 的 初始 化 


12.4.5 类 maxHeap 


类 maxHeap 用 来 实现 一 个 最 大 优先 级 队列 。 类 的 数据 成 员 是 heap (一 个 类 型 为 T 的 一 维 
数组 )、arrayLength ( 数组 heap 的 容量 ) 和 heapSize( 堆 的 元 素 个 数 )。top 方法 在 堆 为 空 时 ， 
抛 出 一 个 异常 queueEmpty， 在 堆 不 为 空 时 ， 返 回 一 个 值 heap[1]。 相 应 的 代码 被 省 略 。 程 序 
12-2 是 push 函数 的 代码 ， 程 序 12-3 是 pop 函数 的 代码 ， 它 们 分 别 实现 了 12.4.2 节 和 12.4.3 
节 的 算法 描述 。 
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程序 12-2 ”大 根 堆 的 插入 





template<class T> 
void maxHeap<T>::pushl(const Tg& theElement) 
{/ 把 元 素 theElement 加 入 堆 


/ 必要 时 增加 数组 长 度 

if (heapSize == arrayLength -~ 1) 

{1/ 数组 长 度 加 售 
changeLengthlD (heap, arrayLength, 2 * arrayLength); 
arrayLength *= 27 

} 


// 为 元 素 theElement 寻找 插入 位 置 
/ currentNode 从 新 叶子 向 上 移动 
int currentNode = ++heapSize; 
while (currentNode != 1 && heap[currentNode / 2] < theElement) 
{ 
1/ 不 能 把 元 素 theElement 插入 在 heap[currentNode] 


heap [currentNode] = Heap[currentNode / 2]; 1/ 把 元 素 向 下 移动 
currentNode /= 2; //currentNode 移 向 双亲 
} 
heap[currentNode] = theElement; 


程序 12-3 ”从 大 根 堆 删 除 最 大 元 素 


template<class T> 
void maxHeap<T>: :pop() 


{1/ 删除 最 大 元 素 
// 如 果 扒 为 空 ， 抛 出 异常 
if (heapSize == 0) 1/ 堆 为 空 


throw queueEmpty () > 


/删除 最 大 元 素 
heap[1] .~T(); 


// 删除 最 后 一 个 元 素 ， 然 后 重新 建 堆 


T lastElement = heap[heapSize--]; 


/ 从 根 开始 ， 为 最 后 一 个 元 素 寻 找 位 置 
int currentNode = 1, 
child = B; 1/ currentNode 的 孩子 
while {child <= heapSize) 
{ 
l/heap[child] 应 该 是 currentNode 的 更 大 的 孩子 
it (child < heapSize && heap[child] < heap[child + 1]) 
child++; 


// 可 以 把 lastElement 放 在 heap[currentNode] 吗 ? 
if (lastElement >= heap[child]) 


break; /可 以 


/不 可 以 


304 党 二 部 分 履 据 络 芍 





heab [currentNode] = heap[child]: /把 孩子 child 向 上 移动 
currentNode = child; // 向 下 移动 一 层 寻 找 位 置 
ehild. *= 2: 

} 

heaplcurrentNode] = lastElement; 


} 


在 插入 函数 push 的 代码 中 ， 首 先 确定 数组 heap 是 否 有 空间 容纳 新 元 素 。 若 没有 ， 则 数 
组 空间 容量 加 倍 。 然 后 令 变量 currentNode 指向 新 叶子 节点 的 位 置 ，heapSize。 接 下 来 ， 沿 
着 从 新 叶子 节点 到 根 的 路 径 进 行 遍历 。 实 际 上 ， 是 把 新 元 素 theElement 沿 着 这 条 路 径 起 泡 上 
浮 ， 直 至 达到 合适 的 位 置 。 在 每 一 次 确定 上 移 位 置 currentNode 的 值 时 ， 我 们 都 要 判断 ， 是 
否 到 达 根 ( 即 currentNode=1 )， 或 者 是 否 在 currentNode 位 置 插 和 人 新 元 素 之 后 符合 大 根 树 的 
特性 ( 即 theElement 反 heap[currentNode/2] )。 如 果 有 一 个 条 件 成 立 ， 就 把 新 元 素 theElement 
插 到 位 置 currentNode。 否 则 ， 就 进入 while 循环 体 ， 把 位 置 currentNode/2 的 元 素 移 到 位 置 
currentNode， 然 后 令 currentNode=currentNode/2。 对 2 个 元 素 的 大 根 堆 ( 即 heapSize=z )， 
while 循环 的 迭代 次 数 是 O(height)=O(logn)， 每 次 迭代 的 时 间 是 6(1)。 因 此 ，push 所 需 的 时 
间 (不 包括 数组 容量 加 倍 的 时 间 ) 是 O(logn)。 

pop 操作 要 删除 的 是 堆 中 最 大 元 素 ， 它 存储 在 根 heap[1] 中 。 删 除 过 程 是 ， 把 堆 的 最 后 一 
个 元 素 heap[heapSize] 保存 到 变量 lastElement， 然 后 堆 的 元 素 个 数 heapSize 减 1。 在 while 循 
环 中 ， 我 们 把 数组 heap 重建 为 大 根 堆 。 重 建 堆 的 过 程 是 为 存储 在 lastElement 中 的 元 素 寻 找 合 
适 的 插入 位 置 。 寻 找 过 程 从 根 开始 沿 堆 向 下 进行 。 对 n 个 元 素 的 堆 ，while 循环 的 执行 次 数 为 
O(logn)， 而 且 每 次 循环 所 需 时 间 为 6(1)， 因 此 ，pop 操作 的 时 间 复 杂 性 为 O(logn)。 

方法 initialize ( 见 程 序 12-4 ) 在 数组 theHeap 中 建 堆 。 函 数 一 开 始 ， 令 heap 指向 数组 
theHeap，heapSize 等 于 数组 中 元 素 个 数 theSize。 在 for 循环 中 ,我 们 从 最 后 一 个 具有 孩子 
的 节点 开始 到 根 节点 进行 扫描 ， 并 用 root 表示 正在 处 理 的 节点 。 对 于 每 一 个 root 值 ， 组 入 的 
while 循环 把 以 root 为 根 的 子 树 调整 为 大 根 堆 。 注 意 ，for 循环 与 程序 12-3 的 pop 函数 是 相 
似 的 。 


程序 12-4 ”初始 化 一 个 非 空 大 根 堆 


template<class T> 
void maxHeap<T>::initialize(T *theHeap, int theSize) 
{// 在 数组 theHeap[1:theSize] 中 建 大 根 堆 

delete [] heap; 

heap = theHeap; 

heapSize = thesSize; 


1 堆 化 
for (int root = heapSize / 2; root >= 1; root--) 
{ 

T rootElement = heaplroot]; 


// 为 元 素 rootElement 寻找 位 置 
int child = 2 * root; /孩子 child 的 双亲 是 元 素 rootElement 的 位 置 
while (child <= heapSize) 
{ 
/heap [child] 应 该 是 兄弟 中 较 大 者 
if (child < heapSize && heap[child] < heap[child + 1]) 
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ehdldi®} 
/ 可 以 把 元 素 rootElement 放 在 heap[child/2] 吗 
if (rootEl]jement >= heap[child]) 

break; /可 以 


/ 不 可 以 


heap [child / 2] = heaplchild]; // 把 孩子 向 上 移 
child *= 2，; 1/ 移 到 下 一 层 
} 
heap[child / 2] = rootElement,; 
} 
} 
吕 数 initialize 的 复杂 性 


在 程序 12-4 的 initialize 函数 中 ， 如 果 元 素 个 数 为 n ( 即 theSize=n )， 那么 for 循环 的 每 
次 迭代 所 需 时 间 为 O(logm， 和 迭代 次 数 为 n/2， 因 此 initialize 函数 的 复杂 性 为 O(nlogn)。 注 意 ， 
O 表示 法 提供 算法 复杂 性 的 上 限 。 实 际 应 用 中 ，initialize 的 复杂 性 要 比 上 限 O(nlogn) 好 一 些 。 
经 过 更 仔细 的 分 析 ， 我 们 得 出 真正 的 复杂 性 为 6(n)。 

在 initialize 函数 中 ，while 循环 的 每 一 次 迭代 所 需 时 间 为 0(h;))， 其 中 hj; 是 以 位 置 i 为 根 
节点 的 子 树 的 高 度 。 完 全 二 又 树 heap[1:n] 的 高 度 为 h =|log,(n+1)|]。 在 树 的 第 j 层 ， 最 多 有 
2 个 节点 。 因 此 最 多 有 2 个 节点 具有 相同 的 高 度 h=h-j+1。 于 是 大 根 堆 的 初始 化 时 间 为 


o(2200 —j+ 1D) 三 o> | S o(2'% 2)) = 0(2) = O(n) 


这 个 公式 的 推导 与 练习 10 一致。 


天 +2 ( 12-1 ) 
7 2= 


因为 for 循环 执行 n/2 次 迭代 ， 所 以 复杂 性 为 8(n)。 将 两 者 综合 考虑 ， 得 到 initialize 的 
复杂 性 为 9(n)。 
12.4.6 ” 堆 和 STL 


STL 的 类 priority_queue 利用 了 基于 向 量 的 堆 来 实现 大 根 堆 ， 它 允许 用 户 自己 制定 优先 级 
的 比较 函数 ， 因 此 ， 这 个 类 也 可 以 用 于 实现 小 根 堆 。 





练习 


6. 考虑 数组 theHeap=[-,3,5,6,7,20,8,2,9,12,15,30,17]。 

1 ) 画 出 相应 的 完全 二 又 树 。 

2 ) 用 程序 12-4 的 方法 在 数组 中 建 堆 。 分 别 用 数组 和 树 的 形式 显示 结果 。 

3 ) 使 用 程序 12-2 的 方法 ， 顺 序 插 人 15、20 和 45。 显 示 每 一 次 插入 之 后 的 大 根 堆 。 

4 ) 使 用 程序 12-3 的 方法 ， 对 3 ) 的 结果 执行 4 次 最 大 元 素 删 除 。 显 示 每 一 次 删除 后 的 大 
根 堆 。 

以 初始 数组 [-,10,2,7,6,5,9,12,35,22,15,1,3,4] 为 对 象 ， 做 练习 6。 

以 初始 数组 [-,1,2,3,4,5,6,7,8,9,10,12,15,22,35] 为 对 象 ， 做 练习 6。 


Es 
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9. 以 初始 数组 [-,30,17,20,15,10,12,5,7,8,5,2,9] 为 对 象 ， 做 练习 6。 不 过 与 2 ) 不 同 的 是 建立 的 
是 小 根 堆 ， 与 3 ) 不 同 的 是 ， 搬 人 元 素 为 1、10、6 和 4。 与 4) 不 同 的 是 ， 执 行 3 次 最 小 
元 素 删除 。 

10. 对 m 用 归纳 法 证 明 公 式 ( 12-1 )。 

11. 编写 类 mapHeap 的 复制 构造 函数 。 测 试 代码 。 

12. 在 maxHeap 类 中 加 入 一 个 公有 成 员 函 数 changeMax ( newElement )， 它 用 元 素 newElement 

替代 最 大 元 素 ，newElement 的 优先 级 可 以 大 于 或 小 于 当前 最 大 元 素 heap[1] 的 优先 级 。 
和 pop 方法 一 样 ， 代 码 应 该 从 根 开 始 ， 沿 着 一 条 向 下 的 路 径 遍 历 。 代 码 的 复杂 性 应 为 
O(logn)， 其 中 是 大 根 堆 的 元 素 个 数 。 证 明 这 个 结论 。 测 试 代码 的 正确 性 。 
13. 在 maxHeap 类 中 加 入 一 个 公有 成 员 函 数 remove(i)， 它 删除 并 返回 heap[i] 的 元 素 。 代 码 的 
复杂 性 应 为 O(logn)， 其 中 n 是 大 根 堆 的 元 素 个 数 。 证 明 这 个 结论 。 测 试 代码 的 正确 性 。 
14. 为 类 maxHeap 设计 一 个 迭代 器 。 可 以 按 任意 顺序 计数 元 素 个 数 。 对 n 元 素 大 根 堆 进 行 计 
数 所 需 时 间 应 为 O(n)。 证 明 这 个 结论 。 测 试 代码 的 正确 性 。 

15. 在 程序 12-3 的 函数 pop 中 ，lastElement 从 堆 的 底部 取出 ， 重 新 插入 大 根 堆 的 ， 但 仍 插 到 
接近 大 根 堆 底 部 的 地 方 。 请 重新 写 一 个 pop 函数 ， 让 根 节点 的 空位 置 先 移 到 叶 节 点 ， 然 后 
从 这 个 叶 节 点 往 上 ， 为 lastElement 寻找 合适 的 位 置 。 通 过 实验 来 比较 新 代码 是 否 比 旧 代 
码 执行 速度 快 。 

16. 根据 下 面 的 假设 ， 重 新 编写 类 maxHeap 的 方法 。 

1 ) 在 创建 堆 时 ， 创 建 者 应 该 提供 两 个 元 素 maxElement 和 minElement。 堆 中 没有 元 素 比 
maxElement 大 ， 也 没有 元 素 比 minElement 小 。 

2 ) 一 个 n 元素 的 堆 需 要 一 个 数组 heap[0:2n+1]。 

3 ) na 个 元 素 按 本 节 所 描述 的 方法 存储 在 heap[1:n] 中 。 

4 ) maxElement 存储 在 heap[0] 中 。 

5 ) minElement 存储 在 heap[n+1:2n+l] 中 。 

这 些 假设 应 该 使 push 和 pop 的 代码 简化 。 通 过 实验 将 本 练习 的 实现 与 本 节 的 实现 做 比较 。 

17. 一 个 4 堆 是 一 棵 度 为 4 的 完全 树 。 设 计 一 个 具体 的 类 maxDHeap， 用 d 堆 来 扩展 抽象 类 

maxPriorityQueue。 当 d=2,3,4 时 ， 比 较 maxDHeap 和 maxHeap 的 性 能 。 

18. 以 练习 17 的 类 maxDHeap 为 对 象 ， 做 练习 12。 


12.5 左 高 树 
12.5.1 ”高 度 优先 与 宽度 优先 的 最 大 及 最 小 左 高 树 


12.4 节 的 堆 结构 是 一 种 隐 式 数据 结构 (implicit data structure )。 用 完全 二 又 树 表示 的 堆 在 
数组 中 是 隐 式 存储 的 ( 即 没 有 明确 的 指针 或 其 他 数据 能 够 用 来 重 塑 这 种 结构 )。 由 于 没有 存储 
结构 信息 ， 这 种 表示 方法 的 空间 利用 率 很 高 ， 它 实际 上 没有 浪费 空间 。 而 且 它 的 时 间 效 率 也 
很 高 。 尽 管 如 此 ， 它 并 不 适合 于 所 有 优先 级 队列 的 应 用 ， 尤 其 是 当 两 个 优先 级 队列 或 多 个 长 
度 不 同 的 队列 需要 合并 的 时 候 ， 这 时 我 们 就 需要 其 他 数据 结构 了 。 左 高 树 就 能 满足 这 种 需要 。 

考察 一 棵 二 又 树 ， 它 有 一 类 特殊 的 节点 叫做 外 部 节点 ( external node )， 它 代替 树 中 的 空 
子 树 。 其 余 节 点 叫做 内 部 节点 (internal node )。 增 加 了 外 部 节点 的 二 叉 树 被 称 为 扩充 二 叉 树 
( extended binary tree )， 图 12-6a 是 一 棵 二 又 树 ， 其 相应 的 扩充 二 叉 树 如 图 12-6b 所 示 。 外 部 
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a) 一 棵 二 叉 树 b) 扩充 二 叉 树 
图 12-6 s 和 w 的 值 


令 s(x) 是 从 节点 x 到 其 子 树 的 外 部 节点 的 所 有 路 径 中 最 短 的 一 条 。 根 据 s(x) 的 定义 ， 若 

x 是 外 部 节点 ， 则 s 的 值 为 0; 若 x 为 内 部 节点 ， 则 * 的 值 为 : 
min{s(L), s(R)}+1 

其 中 工 与 RR 分别 为 x 的 左右 孩子 。 扩 充 二 义 树 ( 如 图 12-6b 所 示 ) 中 各 节点 的 s 值 如 图 12-6c 
所 示 。 

定义 12-3 一 裸 二 又 树 称 为 高 度 优 先 左 高 树 ( height-biased leftist tree，HBLT )， 当 且 仅 
当 其 任何 一 个 内 部 节点 的 左 孩 子 的 8 值 都 大 于 或 等 于 右 孩 子 的 值 。 

图 12-6a 不 是 HBLT。 考 察 外 部 节点 4 的 父 节 点 ， 它 的 左 孩 子 的 值 为 0， 而 右 孩 子 
的 值 为 1， 尽 管 其 他 内 部 节点 均 满足 HBLT 的 定义 。 若 将 节点 a 的 父 节点 的 左右 子 树 交 换 ， 
图 12-6a 就 成 为 HBLT。 

定理 12-1 令 x 为 HBLT 的 一 个 内 部 节点 ， 则 

1 ) 以 x 为 根 的 子 树 的 节点 数目 至 少 为 bd 

2 ) 若 以 x 为 根 的 子 树 有 mm 个 节点 ， 那 么 s(x) 最 多 为 log2(m+1)。 

3 ) 从 x 到 一 外 部 节点 的 最 右 路 径 ( 即 从 x 开始 沿 右 孩子 移动 的 路 径 ) 的 长 度 为 s(xX)。 

证 明 根据 s(x) 的 定义 ， 从 x 节点 往 下 第 s(x)-1 层 没 有 外 部 节点 (否则 x 的 s 值 将 更 
小 )。 以 x 为 根 的 子 树 在 当前 层 只 有 1 个 节点 x， 下 一 层 有 2 个 节点 ,再 下 一 层 有 4 个 节 
点 …… 从 x 层 往 下 第 s(x)-1 层 有 2 个 节点 ,在 s(x)-1 层 以 下 可 能 还 有 其 他 节点 ， 因 此 子 树 


x 的 节点 数目 至 少 为 22 20%-1。 从 1) 可 以 推出 2)。 根据 s 的 定义 以 及 HBLT 的 一 个 节 


点 的 左 孩 子 的 s 值 总 是 大 于 或 等 于 其 右 孩子 ， 可 以 推出 3 )。 西 

定义 12-4 若 一 棵 HBLT 同时 还 是 大 根 树 ， 则 称 为 最 大 HBLT (max HBLT )。 藻 一 棵 
HBLT 同时 还 是 小 根 树 ， 则 称 为 最 小 HBLT (min HBLT )。 

图 12-1 的 大 根 树 及 图 12-2 的 小 根 树 都 是 HBLT， 因 此 ， 图 12-1 的 树 是 最 大 HBLT， 
图 12-2 中 的 树 是 最 小 HBLT。 最 大 优先 级 队列 可 以 用 最 大 HBLT 表示 ， 最 小 优先 级 队列 可 用 
最 小 HBLT 表示 。 

如 果 我 们 考虑 的 不 是 路 径 长 度 ， 而 是 节点 数目 ， 那 么 我 们 可 以 得 到 另 一 种 左 高 树 。 定 义 
重量 w(x) 是 以 节点 x 为 根 的 子 树 的 内 部 节点 数目 。 若 x 是 外 部 节点 ， 则 它 的 重量 是 0; 若 x 
是 内 部 节点 ， 则 它 的 重量 是 其 孩子 节点 的 重量 之 和 加 1， 在 图 12-6a 的 二 叉 树 中 ， 各 节点 的 重 
量 如 图 12-6d 所 示 。 

定义 12-5 一 棵 二 又 树 称 为 重量 优先 左 高 树 〈weight-biased leftist tree，WBLT )， 当 了 且 
仅 当 其 任何 一 个 内 部 节点 的 左 孩 子 的 w 值 都 大 于 或 等 于 右 孩 子 的 w 值 。 若 一 棵 WBLT 同时 
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还 是 大 根 树 ， 则 称 为 最 大 WBLT (max WBLT )。 若 一 柠 WBLT 同时 还 是 小 根 树 ， 则 称 为 最 小 
WBLT (min WBLT )。 

同 HBLT 类 似 ， 具 有 mm 个 节点 的 WBLT 的 最 右 路 径 长 度 最 多 为 logs(m+1)。 使 用 WBLT 
或 HBLT， 可 以 执行 优先 级 队列 的 查找 、 揪 和 人 入、 删除 操作 ， 其 时 间 复 杂 性 与 堆 相 同 。 和 堆 一 
样 ，WBLT 与 HBLT 可 以 在 线性 时 间 内 完成 初始 化 。 用 WBLT 或 HBLT 表示 的 两 个 优先 级 队 
列 可 在 对 数 时 间 内 合并 为 一 个 ， 而 用 堆 表 示 的 优先 级 队列 做 不 到 这 一 点 。 

WBLT 的 查找 、 插 入 、 删 除 、 合 并 和 初始 化 操作 与 HBLT 的 相应 操作 很 相似 ， 因 此 ， 以 
下 仅 介 绍 有 关 HBLT 的 操作 。WBLT 的 操作 将 留 做 练习 ( 练习 24 )。 


12.5.2 最 大 HBLT 的 插入 


最 大 HBLT 的 插入 操作 可 利用 最 大 HBLT 的 合并 操作 来 实现 。 假 定 将 元 素 x 插 入 名 为 H 
的 最 大 HBLT 中 。 如 果 构 建 一 棵 仅 有 一 个 元 素 x 的 最 大 HBLT， 然 后 将 它 与 万 进行 合 并 ， 那 
么 合并 后 的 最 大 HBLT 将 包括 玉 的 全 部 元 素 和 元 素 x。 因 此 ， 要 插入 一 个 元 素 ， 可 以 先 建立 
一 棵 新 的 只 包含 这 个 元 素 的 HBLT， 然 后 将 这 棵 新 的 HBLT 与 原来 的 HBLT 合并 。 


12.5.3 最 大 HBLT 的 删除 


最 大 元 素 在 根 中 。 若 根 被 删除 ， 则 分 别 以 左右 孩子 为 根 的 子 树 是 两 棵 最 大 HBLT。 将 这 
两 棵 最 大 HBLT 合并 ， 便 是 删除 后 的 结果 。 因 此 ， 删 除 操作 可 以 通过 删除 根 元 素 之 后 的 两 棵 
子 树 的 合并 来 实现 。 


12.5.4 ”两 棵 最 大 HBLT 的 合并 


具有 nn 个 元 素 的 HBLT， 其 最 右 路 径 的 长 度 为 O(logn)。 一 个 算法 要 合并 两 棵 HBLT， 只 
能 在 遍历 其 最 右 路 径 中 进行 。 由 于 在 每 个 节点 上 实施 合并 所 需 时 间 为 0(1)， 所 以 合并 算法 的 
时 间 复 杂 性 是 合并 后 节点 数 的 对 数 。 因 此 算法 从 两 棵 HBLT 的 根 开始 仅 沿 右 孩 子 移动 。 

合并 策略 最 好 用 递归 来 实现 。 令 4、B 为 需要 合并 的 两 棵 最 大 HBLT。 若 一 个 为 室 ， 则 另 
一 个 便 是 合并 的 结果 。 假 设 两 者 均 不 为 空 。 为 实现 合并 ， 先 比较 两 个 根 元 素 ， 较 大 者 作为 合 
并 后 的 根 。 假 定 4 的 根 较 大 ， 且 左 子 树 为 L。 令 C 是 4 的 右 子 树 与 8 合 并 而 成 的 HBLT。4 
与 8 合 并 的 结果 是 以 4 为 根 ， 以 L 和 C 为 子 树 的 最 大 HBLT。 如 果 工 的 s 值 小 于 C 的 s 值 ， 
则 C 为 左 子 树 ， 否 则 工 为 左 子 树 。 

例 12-3 考察 图 12-7a 所 示 的 两 棵 最 大 HBLT， 每 个 节点 的 值 都 标 在 节点 的 外 面 ， 元 
素 的 值 都 标 在 节点 的 里 面 。 如 果 是 两 棵 将 要 合并 的 最 大 HBLT， 那 么 根 较 大 的 树 在 左边 。 根 
据 这 种 约定 ,左边 HBLT 的 根 总 是 合并 后 的 HBLT 的 根 。 右 边 HBLT 的 节点 用 阴影 表示 。 

因为 9 的 右 子 树 为 空 ， 因 此 9 的 右 子 树 与 根 为 7 的 树 合并 后 是 根 为 7 的 树 ， 把 这 棵 树 暂 
时 作为 9 的 右 子 树 ， 结 果 如 图 12-7b 所 示 。 此 时 9 的 左 子 树 的 s 值 为 0， 而 右 子 树 的 s 值 为 1， 
将 其 左右 子 树 交换 ， 结 果 如 图 12-7c 所 示 。 

下 面 来 合并 图 12-7d 的 两 棵 最 大 HBLT。 左 边 树 的 根 将 作为 合并 后 的 根 。 当 10 的 右 子 树 
与 根 为 7 的 HBLT 合 并 时 ， 结 果 仍 为 后 者 。 把 这 棵 树 作 为 10 的 右 子 树 ， 结 果 如 图 12-7e 所 
示 。 比 较 10 的 左右 孩子 的 值 ， 得 知 不 必 交 换 。 

现在 合并 图 12-7f 的 两 棵 最 大 HBLT。 左 边 树 的 根 将 作为 合并 后 的 根 。 首 先 把 18 的 右 子 
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树 与 根 为 10 的 树 合 并 ， 其 过 程 与 图 12-7d 的 情形 完全 一 致 ， 合 并 的 结果 如 图 12-7e 所 示 。 把 
这 棵 树 作 为 18 的 右 子 树 ， 结 果 如 图 12-7g 所 示 。 比 较 18 的 左右 子 树 的 s 值 ， 可 知 这 两 棵 子 
树 必 须 交换 ,交换 后 如 图 12-7h 所 示 。 


号 多 © 3 浊 
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图 12-7 最 大 HBLT 的 合并 


作为 最 后 一 个 例子 ， 我 们 来 合并 图 12-7i 的 两 棵 最 大 HBLT。 同 前 面 的 例子 一 样 ， 左 边 
树 的 根 将 成 为 合并 后 的 根 。 首 先 把 40 的 右 子 树 与 根 为 18 的 树 合并 ， 这 个 过 程 与 图 12-7f 的 
合并 过 程 完 全 一 致 ， 合 并 的 结果 为 图 12-7h 所 示 。 把 图 12-7h 作为 40 的 右 子 树 ， 结 果 如 图 
12-7j 所 示 。 由 于 40 的 左 子 树 的 s 值 比 其 右 子 树 的 s 值 小 ， 因 此 将 这 两 棵 子 树 交换 ， 最 后 得 到 
图 12-7k 所 示 的 结果 。 注 意 ， 在 合并 图 12-7i 的 最 大 HBLT 时 ， 首 先 移动 到 40 的 右 孩 子 ， 再 
移动 到 18 的 右 孩 子 ， 最 后 移动 到 10 的 右 孩 子 ， 所 有 的 移动 都 是 按照 当前 最 大 HBLT 的 最 右 
路 径 进行 的 。 加 


12.5.5 ”初始 化 


初始 化 过 程 是 将 n 个 元 素 逐 个 插入 最 初 为 空 的 最 大 HBLT， 所 需 时 间 为 O(nlogn)。 为 得 
到 具有 线性 时 间 的 初始 化 算法 ， 我 们 首先 创建 款 个 仅 含 一 个 元 素 的 最 大 HBLT， 这 交 棵 树 组 
成 一 个 FIFO 队列 ， 然 后 从 队列 中 依次 成 对 删除 HBLT， 然 后 将 其 合并 后 再 插 人 队列 末尾 ， 直 
到 队列 只 有 一 棵 HBLT 为 止 。 

例 12-4 我 们 和 希望 构造 一 棵 最 大 HBLT， 它 具有 5 个 元 素 : 7、1、9、11 和 2。 首先 构造 
5 个 单元 素 的 最 大 HBLT， 并 形成 一 个 FIFO 队列 。 把 最 前 面 的 两 棵 最 大 HBLT (7 和 1) 从 队 
列 中 删除 并 合并 ， 结 果 如 图 12-8a 所 示 ， 然 后 将 其 加 入 队列 。 下 一 步 ， 从 队列 中 删除 两 棵 最 
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大 HBLT (9 和 11) 并 合并 ,结果 如 图 12-8b 所 示 ， 然 后 将 其 加 入 队列 。 现 在 ， 从 队列 中 删 
除 的 两 棵 最 大 HBLT 是 2 和 图 12-8a， 合 并 后 如 图 12-8c 所 示 ， 然 后 将 其 插 人 队列 。 最 后 要 从 
队列 中 删除 的 一 对 HBLT 是 图 12-8b 和 图 12-8c， 合 并 后 如 图 12-8d 所 示 ， 然 后 插入 队列 。 至 


此 ， 队 列 只 有 一 棵 最 大 HBLT， 初 始 化 工作 完成 。 病 
PPA A 
: 
(1) (2) 
a) b) c) d) 


图 12-8 最 大 HBLT 的 初始 化 


12.5.6 ”类 maxHblt 


在 一 棵 最 大 HBLT 中 ， 节 点 的 数据 类 型 是 binaryTreeNode<pair<int,T>>， 其 中 binaryTreeNode 
如 程序 11-1 所 示 ; pair 的 第 一 个 成 员 是 节点 的 s 值 ， 第 二 个 成 员 是 优先 级 队列 元 素 。 我 们 
用 类 maxHblt 实现 一 棵 最 大 HBLT， 它 扩展 了 类 linkedBinaryTree ( 见 程 序 11-9 )。 基 本 方法 
empty、size 和 top 的 代码 与 maxHeap 的 类 似 。 

在 maxHblt 中 ， 因 为 push、pop 和 initialize 方法 都 利用 了 合并 操作 ， 所 以 首先 考察 合 
并 操作 。 公 有 成 员 函 数 meld(maxHblt<T>&theMaxHblt) 把 两 棵 最 大 HBLT 合 并， 合并 对 象 
是 *this 和 theMaxHblt， 合 并 结果 是 *this。 合 并 过 程 是 调用 私有 成 员 函 数 meld(x,y) ( 见 程序 
12-5 ) 来 完成 的 ， 这 是 一 个 递归 函数 ， 把 根 为 x 和 根 为 y 的 两 棵 最 大 HBLT 合并 ,合并 后 的 
最 大 HBLT 以 x 为 根 。 

程序 12-5 是 私有 成 员 函 数 meld。 该 函数 首先 处 理 特殊 情况 : 要 合并 的 两 棵 树 至 少 有 一 
棵 为 空 。 当 两 棵 树 都 不 空 时 ， 要 确保 x 的 根 元 素 大 于 y 的 根 元 素 ， 否 则 x 与 y 交换 。 接 下 来 ， 
通过 递归 ， 把 x 的 右 子 树 与 y 合并 。 合 并 后 ， 为 保证 结果 是 最 大 HBLT，x 的 左右 孩子 可 能 需 
要 交换 ， 这 需要 计算 它们 的 * 值 才能 确定 。 


程序 12-5 合并 两 棵 左 高 树 


template<class T> 
void maxHblt<T>: :meld (binaryTreeNode<pair<int, T> >* &Xr 
binaryTreeNode<pair<int, T> >* g&y) 
{1/ 合并 分 别 以 *x 和 *y 为 根 的 两 棵 左 高 树 
1/ 合并 后 的 左 高 树 以 x 为 根 ， 返回 x 的 指针 
if (y == NULL) 让 y 为 空 
return; 
if (x == NULL) /1x 为 空 
{x = y; return;} 


11x 和 y 都 不 空 ， 必要 时 交换 x 和 y 
if (x->element.second < y->element.second) 
swap (x, y); 


l/x->element.second >= y->element.second 


meld(x->rightChild,y); 
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// 如 果 需 要 ， 交 换 x 的 子 树 ， 然 后 设置 x->element .first 的 值 
IE (x->leftChild == NULL) 
{1/ 左 子 树 为 空 ， 交换 子 树 
x->leftChild = x->rightChild; 
x->rightCchild = NULL; 
x->element.first = 1; 
} 
else 
{/ 只 有 左 子 树 的 s 值 较 小 时 才 交 换 
if (x->leftChild->element.first < x->rightChild->element.first) 
swap (x->leftChild, x->rightcChild); 
1/ 更 新 x 的 s 值 


x->element.first = x->rightChild->element.first + 1; 


为 了 将 元 素 theElement 插 入 一 棵 最 大 HBLT， 程 序 12-6 首 先 创 建 一 棵 只 含 元 素 
theElement 的 最 大 HBLT， 然 后 通过 私有 成 员 函 数 meld 将 此 树 与 要 插入 的 最 大 HBLT 合并 。 

在 程序 12-6 的 pop 代码 中 ， 若 最 大 HBLT 为 空 ， 则 抛 出 一 个 queueEmpty 异常 ; 若 不 为 
空 ， 则 删除 根 ， 然 后 调用 私有 方法 meld 将 其 左右 子 树 合并 。 


程序 12-6 ”公有 方法 meld、push 和 pop 


Template<class T> 
void maxHblt<T>: :meld (maxHblt<T>& theHblt) 
{W 把 左 高 树 *this 和 theHblt 合并 
meldl(root, theHblt.root); 
treeSize += theHblt.treeSize; 
theHblt.root = NULL; 
theHblt.treeSize = 0; 
} 
template<class T> 
void maxHblt<T>::push(const Tg& theElement) 
{// 把 元 素 theElement 插入 左 高 树 
1/ 建立 只 有 一 个 节点 的 左 高 树 
binaryTreeNode<pair<int,T> > *q = 
new binaryTreeNode<pair<int,T> > (pair<int,T>(1, theElement)); 


1/ 将 左 高 树 q 和 原 树 合并 
meld(root,q); 
treeSizett; 


template<class T> 
void maxHblt<T>::pop() 
{// 删除 最 大 元 素 
if (root == NULL) 
throw queueEmpty(); 


1/ 树 不 空 

binaryTreeNode<pair<int,T> > xleft = root->leftChilgd, 
*right = root->rightChild; 

delete root; 

root = left; 
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meld (root, right); 
treeSize--; 


} 


程序 12-7 是 最 大 HBLT 的 初始 化 。 代 码 用 一 个 基于 数组 的 FIFO 队列 保存 在 初始 化 过 程 
中 产生 的 最 大 HBLT。 在 第 一 个 for 循环 中 , 产生 了 7 个 只 含 一 个 元 素 的 最 大 HBLT， 并 将 此 
插入 初始 为 空 的 队列 中 。 在 第 二 个 for 循环 中 ， 每 次 从 队列 中 删除 两 个 最 大 HBLT 进行 合并 ， 
然后 把 结果 加 入 队列 中 。 当 for 循环 结束 时 ， 队 列 仅 有 一 棵 最 大 HBLT。 


程序 12-7 最 大 HBLT 的 初始 化 


template<class T> 

void maxHblt<T>::initialize(T* theElements, int theSize) 

{// 用 数组 theElements[1:theSize] 建立 左 高 树 
arrayQueue<binaryTreeNode<pair<int,T> >*> q(theSize); 


erase (); /使 *this 为 空 
/ 初始 化 树 的 队列 
for (int i = 1 i <= theSize; i++) 


/建立 只 有 一 个 节点 的 树 
9.Push (new binaryTreeNode<pair<int,T> > 
(pair<int,T>(1, theElements[i]))); 


/ 从 队列 中 重复 取出 两 棵 树 合并 

for (i = 1; i <= theSize - 1; I++) 

{1/ 从 队列 中 删除 两 棵 树 合并 
binaryTreeNode<pair<int,T> > xb = q.front();，; 


9q.Ppop(); 
binaryTreeNode<pair<int,T> > *c = q.front(); 
q.Ppop(); 
meldl(b,c); 
1/ 把 合并 后 的 树 插入 队列 
G.Push (b) : 
} 


if (theSize > 0) 
FOGt, = Grfrontt)s 
treeSize = theSize; 
} 


复杂 性 分 析 

top 的 时 间 复 杂 性 是 (1)。Push、pop 和 公有 方法 meld 的 时 间 复 杂 性 与 私有 方法 meld 
的 时 间 复 杂 性 相同 。 而 私有 方法 meld 仅 沿 着 x 和 y 的 右 子 树 移动 ， 因 此 该 函数 的 复杂 性 为 
O(s(x)+s(y))。 因 为 s(x) 和 s(y) 的 最 大 值 分 别 为 logz(m+1) 和 1ogz(n+1)， 其 中 避 与 分 别 是 x 
和 yy 的 元 素 个 数 ， 所 以 私有 方法 meld 的 时 间 复 杂 性 为 O(logm+logn)=O(log(mn))。 

在 分 析 initialize 的 复杂 性 时 ， 为 了 简单 起 见 ， 假 设 n 是 2 的 震 次 方 。 首 先 合并 n/2 对 最 
大 HBLT， 每 棵 最 大 HBLT 含有 1 个 元 素 ;然后 合并 n/4 对 最 大 HBLT， 每 棵 含有 2 个 元 素 ; 
继而 合并 n/8 对 最 大 HBLT， 每 棵 含有 4 个 元 素 ; 如 此 下 去 。 如 果 每 棵 含有 2 个 元 素 ， 那 么 合 
并 两 棵 最 大 HBLT 需 耗 时 O(i+1)。 因 此 initialize 所 花费 的 总 时 间 为 : 


O(n/2 +2# (m4)+3*(n/8)+") = O(n) = O(n) 
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练习 


19. 令 数 组 theElements=[-,3,5,6,7,20,8,2,9,12,15,30,17]。 
1 ) 画 出 程序 12-7 所 创建 的 最 大 左 高 树 。 
2 ) 用 程序 12-6 的 插入 方法 ， 依 次 插入 10、18、11 和 4。 显 示 每 次 插入 后 的 最 大 左 高 树 。 
3 ) 使 用 程序 12-6 的 方法 ， 对 2 ) 的 最 大 左 高 树 实施 3 次 删除 最 大 元 素 的 操作 。 显 示 每 次 
删除 后 的 左 高 树 。 
20. 令 数组 元 素 为 [-,10,2,7,6,5,9,12,35,22,15,1,3,4]， 重 做 练习 19。 


21. 编写 minHblt 类 。 它 与 maxHblt 类 的 差别 仅 在 于 ， 现 在 的 类 成 员 是 最 小 HBLT， 而 不 是 最 
大 HBLT。 
22. 为 maxHblt 类 开发 一 个 迭代 器 。 可 以 用 来 按 任意 顺序 统计 元 素 个 数 。 每 一 次 迭代 的 时 间 复 


杂 性 应 为 0(1)。 证 明 这 个 结果 。 测 试 代码 的 正确 性 。 
23. 开发 一 个 类 maxHbltWithRemoveNode， 它 包含 maxHblt 类 的 所 有 方法 ， 而 且 还 有 公有 方 
法 pushAndReturnNode 和 removeElementInNode。 方 法 pushAndReturnNode(theElement) 
把 元 素 theElement 插 入 左 高 树 ， 返 回 值 是 插入 的 元 素 所 在 的 节点 。 方 法 
removeElementInNode(theNode) 删 除 并 返回 节点 theNode 中 的 元 素 ， 节 点 theNode 也 
从 树 中 删除 。 提 示 : 每 个 节点 增加 一 个 父亲 域 。 在 类 maxHbltWithRemoveNode 中 与 类 
maxHblt 相同 的 方法 ， 其 时 间 复 杂 性 也 应 该 相同 ; 新 增 方法 的 时 间 复 杂 性 应 该 是 O(logn)， 
其 中 是 左 高 树 的 元 素 个 数 。 证 明 这 个 结果 。 测 试 代码 的 正确 性 。 
24. [最 大 WBLT] 
1 ) 在 图 12-1 中 ， 哪 些 ( 如 果 有 ) 二 又 树 是 WBLT ? 
2 ) 令 x 是 WBLT 的 一 个 节点 。 对 w(x) 进行 归纳 证 明 ， 从 x 出 发 到 达 一 个 外 部 节点 的 最 右 
路 径 的 最 大 长 度 为 log2(w(x)+1)。 
3 ) 设计 类 maxWblt， 其 对 象 为 最 大 WBLT。 它 应 该 包括 类 maxHblt 的 所 有 方法 ， 而 且 这 
些 方法 的 代码 应 该 与 类 maxHblt 的 相应 方法 的 代码 具有 相同 的 渐 近 时 间 复 杂 性 。 用 非 
递归 的 代码 实现 私有 成 员 函 数 meld。 因 为 一 个 节点 的 w 值 可 在 向 下 移动 的 过 程 中 计算 
出 来 ， 所 以 程序 12-5 的 自 底 向 上 的 递归 扩展 过 程 ， 虽然 在 HBLT 中 是 必要 的 ， 但 是 在 
WBLT 中 是 多 余 的 。 
4) 最 大 WBLT、 最 大 HBLT 和 大 根 堆 都 可 以 实现 最 大 优先 级 队列 ， 比 较 各 自 的 优 缺 点 。 


25. 在 表示 一 棵 最 大 HBLT 时 ， 可 用 一 个 指向 元 素 值 为 minElement 的 节点 的 指针 ( 见 练习 
16 ) 来 代替 null 指针 。 根 据 这 一 变化 来 修改 最 大 HBLT 的 代码 。 新 代码 是 否 比 原 代码 执行 
得 更 快 ? 

12.6 ”应 用 

12.6.1 堆 排 序 


你 或 许 已 经 注意 到 ， 堆 可 以 用 来 实现 个 元 素 的 排序 ， 所 需 时 间 为 O(nlogn)。 先 用 nn 
个 待 排序 的 元 素来 初始 化 一 个 大 根 堆 ， 然 后 从 堆 中 逐个 提取 ( 即 删除 ) 元 素 。 结 果 ， 这 些 
元 素 按 非 递增 顺序 排列 。 初 始 化 的 时 间 为 0(n)， 每 次 删除 的 时 间 为 O(logn)， 因 此 总 时 间 为 
O(nlogn)。 这 个 时 间 比 第 2 章 的 排序 方法 所 需要 的 时 间 O0z) 要 快 。 





上 述 排序 策略 称 为 堆 排序 (heap sort)， 程 序 12-8 是 它 的 代码 。 在 代码 中 ， 使 用 了 
大 根 堆 的 方法 deactiveArray， 将 maxHeap<T>::heap 置 为 NULL。 这 一 步 是 必要 的 ， 因 为 
maxHeap<T>::initialize 置 maxHeap<T>::heap 为 数组 a， 当 堆 排 序 函 数 退 出 时 ， 大 根 堆 析 构 函 
数 将 删除 maxHeap<T>::heap。 因 此 ， 为 防止 数组 a 被 删除 ， 需 要 调用 deactiveArray。 


程序 12-8 ”用 堆 排 序 给 数组 a[1:n] 排序 


template <class T> 

void heapSort (T al[ll], int n) 

{1/ 使 用 堆 排 序 方法 给 数组 a[1l:n] 排序 
/在 数组 上 建立 大 根 扒 
maxHeap<T> heap (1I) 
heap .initialize(a n); 


/逐个 从 大 根 堆 中 提取 元 素 
EGE (EE 二 二 看 = 工 7 = ly ==) 
{ 

Tx = heap.top(); 

heap.pop(); 

a[i+1] = x; 


} 


/ 从 堆 的 析 构 函数 中 保存 数组 a 
heap.deactivateArray (); 


} 





图 12-9 显示 了 程序 12-8 的 for 循环 对 i 的 最 初 几 次 取 值 的 迭代 过 程 。 循 环 开始 时 的 大 根 
堆 如 图 12-5d 所 示 。 圆 圈 表 示 在 数组 中 属于 大 根 堆 的 部 分 ， 方 框 表示 在 数组 中 已 经 排 好 序 的 
部 分 。 








图 12-9 堆 排 序 


12.6.2 ”机 器 调度 


一 个 工厂 具有 m 台 一 模 一 样 的 机 器 。 我 们 有 个 任务 需要 处 理 。 设 作业 i 的 处 理 时 间 为 
ti;， 这 个 时 间 包 括 把 作业 放 入 机 器 和 从 机 器 上 取 下 的 时 间 。 所 谓 调度 (schedule ) 是 指 按 作业 
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在 机 器 上 的 运行 时 间 分 配 作 业 ， 使 得 

e 一 台 机 器 在 同一 时 间 内 只 能 处 理 一 个 作业 。 

。 一 个 作业 不 能 同时 在 两 台 机 器 上 处 理 。 

e 一 个 作业 i 的 处 理 时 间 是 ti; 个 时 间 单 位 。 

假如 每 台 机 器 在 0 时 刻 都 是 可 用 的 ， 完 成 时 间 ( finish time ) 或 调度 长 度 (length of a 
schedule ) 是 指 完成 所 有 作业 的 时 间 。 在 一 个 非 抢 先 调 度 中 ， 一 项 作业 i 在 一 台 机 器 上 处 理 ， 
从 时 刻 s; 开始 ， 到 时 刻 stti:， 结 束 。 

图 12-10 是 在 3 台 机 器 处 理 7 个 作业 时 所 进行 的 调度 , 7 个 作业 的 处 理 时 间 分 别 为 
(2,14,4,16,6,5,3 )。3 台 机 器 的 编号 分 别 为 M1、M2 和 M3。 每 个 阴影 区 代表 一 个 作业 的 处 理 
时 间 段 ， 阴 影 区 的 数字 是 作业 的 编号 。 根 据 调度 安排 ,机 器 1 (M1 ) 在 0 ~ 16 时 间 内 完成 作 
业 4。 机 器 2 先 在 0 ~ 14 时 间 内 完成 作业 2， 然后 在 14 ~ 17 时 间 内 完成 作业 7。 机 器 3 先 
在 0 ~ 6 时 间 内 完成 作业 5， 然后 在 6 ~ 11 时 间 内 完成 作业 6， 接 下 来 在 11 ~ 15 时 间 内 完 
成 作业 3， 最 后 在 15 ~ 17 时 间 内 完成 作业 1。 注 意 ， 每 个 作业 只 能 在 一 个 机 器 上 完成 ， 时 间 
从 si 到 sitt;， 且 任何 机 器 在 任何 时 间 仅 处 理 一 个 作业 。 完 成 全 部 作业 所 需 时 间 为 17， 因 此 完 
成 时 间或 调度 长 度 为 17。 














图 12-10 三 台 机 器 的 调度 


图 12-10 的 调度 是 一 个 在 给 定 处 理 时 间 前 提 下 最 小 完成 时 间 的 调度 。 为 了 认识 到 这 一 点 ， 
注意 ， 处 理 时 间 的 总 和 是 50。 因 此 ， 每 一 个 三 台 机 器 调度 都 最 少 需要 [50/31= 17 个 时 间 单 位 
才能 完成 作业 。 

我 们 的 任务 是 写 一 个 程序 ， 实 现在 m 台 机 器 上 执行 n 个 作业 的 最 小 完成 时 间 的 调度 。 设 
计 这 种 调度 程序 非常 难 。 实 际 上 ,没有 人 能 够 设计 一 个 具有 和 多项式 时 间 复 杂 性 的 算法 ( 即 一 
个 复杂 性 为 O(n'm') 的 算法 ,上 和 /为 常数 ) 来 解决 最 小 调度 时 间 问 题 。 

调度 问题 是 一 类 臭名 昭著 的 NP- 复杂 问题 ( NP 表示 nondeterministic polynornial ) 中 的 

一 个 。NP- 复杂 及 NP- 完全 问题 是 指 尚未 找到 具有 多 项 式 时 间 复 杂 性 算法 的 问题 。NP- 完全 
问题 是 一 类 判定 问题 ， 也 就 是 说 ， 对 这 类 问题 的 每 一 个 实例 ， 答 案 为 是 或 和 否 。 机 器 调度 问题 
不 是 一 个 判定 问题 ， 因 为 对 每 一 个 问题 实例 ， 都 是 按照 某 种 方案 把 作业 分 配给 机 器 ， 以 使 完 
成 时 间 最 少 。 我 们 可 以 设计 一 个 相关 机 器 调度 问题 ， 除 了 给 定 任务 和 机 器 外 ， 还 给 定 了 时 间 
TMin， 要 求 确定 是 否 存在 一 种 调度 ， 它 的 完成 时 间 为 TMin 或 更 少 。 对 于 这 类 问题 ， 答 案 为 
是 或 否 。 因 此 相关 机 器 调度 问题 是 NP- 完全 问题 。 而 NP- 复杂 问题 可 以 是 判定 问题 ， 也 可 以 
不 是 判定 问题 。 

成 千 上 万 个 具有 实际 意义 的 问题 都 是 NP- 复杂 或 NP- 完 全 问题 ， 如 果 有 人 能 对 一 个 
NP- 复杂 或 NP- 完全 问题 找到 一 个 多 项 式 时 间 算 法 ,那么 他 同时 也 找到 了 能 在 多 项 式 时 间 
内 解决 所 有 NP- 复杂 或 NP- 完全 问题 的 方法 。 虽 然 不 能 证 明 NP- 完全 问题 不 能 在 多 项 式 时 
间 内 解决 ， 但 大 家 都 认为 这 已 是 一 个 事实 。 因 此 ，NP- 复杂 问题 的 优化 问题 经 常用 近似 算法 
(approximation aigorithm ) 解决 ， 虽 然 近似 算法 不 能 保证 得 到 最 优 解 ， 但 是 能 保证 得 到 近似 最 
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优 解 。 

在 我 们 的 调度 问题 中 ， 采 用 了 一 个 简单 调度 策略 ， 称 为 最 长 处 理 时 间 ( longest processing 
time，LPT )， 它 的 调度 长 度 是 最 优 调度 长 度 的 4/3-1/(3m)。 在 LPT 算法 中 ， 作 业 按 处 理 时 间 
的 递减 顺序 排列 。 当 一 个 作业 需要 分 配 时 ， 总 是 分 配给 最 先 变 为 空闲 的 机 器 。 没 有 固定 的 分 
配方 案 。 

对 图 12-10 的 例子 而 言 ， 为 了 建立 LPT 调度 ， 将 作业 按 处 理 时 间 的 递减 次 序 排列 ， 结 果 
为 (4,2,5,6,3,7,1 )。 首 先 为 作业 4 分 配 机 器 ， 因 为 三 台 机 器 均 是 从 0 时 开始 空闲 ， 所 以 作业 4 
可 分 配给 任何 一 台 机 器 。 假 设 分 配给 机 器 1， 于 是 机 器 1 直到 16 时 才 是 可 用 的 。 下 一 个 作业 
2 需要 分 配 机 器 ， 可 以 将 其 分 配给 机 器 2 或 机 器 3， 假 设 分 配给 机 器 2， 于 是 机 器 2 直到 14 
时 才 是 可 用 的 。 然 后 将 作业 5 分 配给 机 器 3, 在 0 ~ 6 时 处 理 。 对 下 一 个 待 分 配 的 作业 6， 最 
先 可 用 的 是 机 器 3， 它 在 6 时 变 为 空闲 ， 因 此 将 作业 6 在 6 ~ 11 时 间 段 分 配给 机 器 3。 机 器 3 
的 下 一 次 空闲 时 刻 变 为 11， 因 此 ， 最 先 变 为 空闲 的 是 机 器 3， 空闲 时 刻 为 11， 于 是 在 11 时 将 
作业 3 分 配给 机 器 3。 继 续 这 种 分 配方 法 ， 即 得 到 图 12-10 的 调度 方案 。 

定理 12-2[Graham] 令 F*(N) 为 在 加 台 机 器 上 执行 作业 集合 1 的 最 佳 调度 完成 时 间 ， 
F(D 为 采用 LPT 调度 策略 所 得 到 的 调度 完成 时 间 ， 则 

FD ;4_ 1 


F*(D 3 3m 


在 实际 应 用 中 ，LPT 调度 比 定理 12-2 所 给 定 的 界限 更 接近 最 佳 算 法 。 实 际 上 ， 图 12-10 
的 LPT 就 是 最 优 方案 。 

可 用 堆 来 建立 LPT 调度 方案 ， 时 间 性 能 为 O(nlogn)。 当 nn < mm 时， 只 需要 将 作业 i 在 
0 ~ ti 时 间 内 分 配给 机 器 i 来 处 理 。 当 n>m 时 ， 可 以 首先 利用 heapSort ( 见 程序 12-8 ) 将 作 
业 按 处 理 时 间 递 增 顺 序 排 列 。 为 了 建立 LPT 调度 方案 ,作业 按 相反 次 序 进行 分 配 。 为 了 决定 
将 一 个 作业 分 配给 哪 一 台 机 器 ， 必 须知 道 哪 台 机 器 最 先 空 闸 。 为 此 ， 维 持 一 个 六 台 机 器 的 小 
根 堆 ， 元 素 类 型 为 machineNode， 它 有 数据 成 员 avail ( 表示 何 时 空闲 ) 和 id (机 器 编号 )。 数 
据 类 型 machineNode 定义 了 成 员 转 换 函 数 如 下 : 


operator int() const{return avail;} 


这 个 成 员 转 换 函 数 使 machineNode 对 象 所 比较 的 是 它们 的 avail 值 。 

pop 函数 用 来 获取 最 先 可 用 的 机 器 。 当 机 器 的 可 用 时 间 增 加 后 ( 因 分 配 了 作业 )， 需 要 再 
次 插入 小 根 堆 。 小 根 堆 的 初始 化 是 为 每 一 台 机 器 插入 一 个 节点 。 因 为 所 有 机 器 的 最 初 可 用 时 
间 都 为 0 时刻， 所 以 它们 的 avail 值 都 为 0。 

用 类 jobNode 表示 作业 ， 它 有 数据 成 员 id ( 作业 的 唯一 标识 符 ) 和 time ( 作业 需要 的 处 
理 时 间 )。 因 为 是 用 堆 排 序 方法 给 作业 排序 ， 而 且 堆 排序 使 用 的 是 大 根 堆 ， 所 以 类 jobNode 定 
义 了 成 员 转 换 函 数 ， 返 回 值 是 time 的 值 。 

程序 12-9 根据 作业 所 需 的 处 理 时 间 af[l:n] 给 个 作业 排序 ， 然 后 用 LPT 方法, 在 m 台 
机 器 上 实现 任务 调度 。 





程序 12-9 基于 a[1:n] 的 m 台 机 器 的 LPT 调度 
void makeSchedule (jobNode al[], int n, int m) 
{1/ 输出 一 个 基于 n 个 作业 a[1:n] 的 m 台 机 器 的 LPT 调度 
if (n <= m) 


{ 
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cout << "Schedule each job on a different machine." << endl; 
returny 


} 
heapSort (a, n); // 按 递增 顺序 排序 


1/ 初始 化 m 台 机 器 ， 建 立 小 根 堆 

minHeap<machineNode> machineHeap (m); 

for (int i = 1; i <= m; i++) 
machineHeap.push (machineNode (i, 0)); 


/生成 调度 计划 

for (int 土 = n; 1 >= lr 1==) 

{/ 把 作业 工 安 排 在 第 一 合 空闲 的 机 器 
machineNode x = machineHeap.top(); 


machineHeap.pop(); 
cout << "Schedule job " << al[lil].id 


<< " on machine " << x.id << " from " << x.avail 
<<" to" << (x.avail + alilj .time) << endl; 
x.avail += al[lil] .time; /这 人 台 机 器 新 的 空闲 空间 


machineHeap .Push (x); 


} 


函数 makeSchedule 的 复杂 性 分 析 

当 n < m 时，makeSchedule 函数 所 需 时 间 为 6(1)。 当 n>m 时 ， 堆 排序 时 间 为 O(nlogn)。 
堆 的 初始 化 时 间 是 O(m)， 因 为 尽管 执行 了 m 次 插入 ,但 所 有 元 素 的 值 相同 ， 因 此 每 次 插入 的 
时 间 都 为 6(1)。 在 第 二 个 for 循环 中 ,执行 了 n 次 top、n 次 pop 和 nn 次 push 操作 ， 每 次 top 
的 时 间 是 0(1)， 每 次 pop 和 push 的 时 间 是 Oldogm)。 因 此 第 二 个 for 循环 时 间 为 O (nlogm )。 
于 是 ， 对 n>m，makeSchedule 函数 的 总 时 间 为 O(nlogn+nlogm)=O(nlogn)。 


12.6.3” 霍 夫 曼 编码 


在 10.6 节 中 介绍 了 一 种 基于 LZW 算法 的 文本 压缩 器 ， 这 种 算法 依据 的 是 子 串 在 文本 中 
的 重复 出 现 。 而 霍 夫 曼 编码 (Huffman code ) 是 另外 一 种 文本 压缩 算法 ， 这 种 算法 依据 的 是 
不 同 符号 在 一 段 文本 中 相对 出 现 的 频率 。 假 设 一 个 文本 是 由 字符 a、u、x 和 z 组 成 的 字符 串 ， 
它 的 长 度 为 1000， 每 个 字符 用 1 字 节 来 存储 ， 共 需 1000 字 节 ( 即 8000 位 )。 如 果 每 个 字符 
用 2 位 二 进 制 来 编码 (00=a,，01=x，10=u,，11=z )， 那 么 用 2000 位 空间 即 可 表示 1000 个 字符 。 
此 外 ， 我 们 还 需要 一 定 的 空间 来 存放 编码 表 ， 它 可 以 采用 如 下 的 存储 格式 : 

符号 个 数 ， 代 码 1， 符 号 1， 代 码 2， 符 号 2，… 

符号 个 数 及 每 个 符号 分 别 占 8 位 ， 每 个 代码 占 | log: ( 符号 个 数 ) ] 位 。 因 此 ， 在 本 例 中 ， 编 
码 表 需 占用 5*8+4*2=48 位 。 压 缩 比 为 8000/2048=3.9。 

利用 上 述 编码 方法 ， 字 符 串 aaxuaxz 的 编码 为 00000110000111。 因 为 每 个 字符 的 代码 都 
占 2 位 ， 所 以 ， 从 左 到 右 ， 每 次 从 编码 中 提取 2 位 数字 通过 编码 表 翻 译 ， 便 可 获得 原 字符 串 。 

在 字符 串 aaxuaxz 中 ，a 出 现 3 次 。 一 个 符号 出 现 的 次 数 称 为 频率 ( frequency )。 符 号 a、 
x、u、z 在 这 个 字符 串 中 出 现 的 频率 分 别 是 3、2、1、1。 当 不 同 字符 出 现 的 频率 有 很 大 差别 时 ， 
我 们 可 以 通过 可 变 长 编码 来 缩短 编码 串 的 长 度 。 如 果 使 用 编码 ( 0=a，10=x，110=u，111=z) 
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则 aaxuaxz 的 编码 为 0010110010111， 编 码 串 长 度 是 13 位 ， 比 原来 的 14 位 要 稍 短 一 些 。 当 不 
同 字符 的 出 现 频 率 相差 更 大 时 ， 编 码 串 的 长 度 差别 就 会 更 明显 。 如 果 4 个 字符 的 频率 分 别 为 
(996，2，1，1 )， 则 每 个 字符 用 2 位 编码 所 得 到 编码 串 长 度 为 2000 位 ， 而 用 可 变 长 编码 所 得 
到 编码 串 长 度 仅 为 1006 位 。 

但 是 怎样 对 编码 串 进 行 解码 呢 ? 若 每 个 代码 为 2 位， 则 解码 很 容易 一 只 需 每 次 提取 2 
位 代码 ， 然 后 通过 编码 表 来 确定 它 所 对 应 的 符号 。 若 使 用 可 变 长 编码 ， 则 不 知道 每 次 应 取出 
多 少 位 。 字 符 串 aaxuaxz 的 编码 为 001011001011， 当 从 左 至 右 解码 时 ， 我们 需要 知道 第 一 个 
字符 的 代码 是 0、00， 还 是 001。 因 为 没有 一 个 字符 的 代码 以 00 开头 ， 所 以 第 一 个 字符 的 代 
码 必 是 0。 根 据 编码 表 ， 该 字符 是 a。 下 一 个 代码 为 0、01 或 010。 同 理 ， 因 为 不 存在 以 01 打 
头 的 代码 ， 因 此 代码 必 为 0。 继 续 使 用 这 种 方法 ， 就 可 以 解码 。 

上 述 方法 为 什么 可 以 解码 呢 ? 在 使 用 的 4 种 代码 (0，10，110，111 ) 中 ,没有 任何 一 个 
代码 是 另 一 代码 的 前 级 。 因 此 ， 当 从 左 到 右 检查 编码 位 串 时 ， 可 以 得 到 与 一 个 确切 的 代码 相 
匹配 的 字符 。 

可 以 利用 扩展 二 又 树 ( 见 12.5.1 节 定 义 ) 来 派生 一 个 特殊 的 类 ， 对 具有 上 述 前 组 性 质 的 
代码 ， 实 现 可 变 长 编码 。 这 个 用 于 编码 的 类 称 为 霍 夫 曼 编 码 。 

在 一 棵 扩展 二 又 树 中 ， 从 根 到 外 部 节点 的 路 径 可 用 来 编码 ， 方 法 是 用 0 表示 向 左 子 树 移 
动 一 步 ， 用 1 表示 向 右 子 树 移 动 一 步 。 在 图 12-6b 中 ， 从 根 到 外 部 节点 b 的 路 径 代码 是 010， 
从 根 到 节点 (a，b，c，d，e,，f) 的 路 径 代码 分 别 为 (00，010,，011，100，101，11 )。 因 为 
每 一 条 路 径 正 好 是 另 一 条 路 径 的 前 半 程 ， 所 以 没有 一 个 路 径 代码 是 另 一 个 路 径 代码 的 前 绥 。 
因此 ， 这 些 代码 可 以 分 别 用 来 对 字符 a，b，…, f 编 码 。 令 3 是 由 这 些 字符 组 成 的 字符 串 ， 
F(x) 是 字符 x 的 出 现 频率 ， 其 中 x 属于 集合 fa, s, c, d,e, fj。 若 利用 这 些 代码 对 进行 编码 ， 
则 编码 位 串 的 长 度 : 

2*F(a)+3*F(b)+3*F(c)+3*F(d)+3*F(e)+2*F(f) 

对 于 一 棵 具有 个 外 部 节点 的 扩展 二 叉 树 ， 且 外 部 节点 标记 为 1，…，n， 其 对 应 的 编码 
位 串 的 长 度 为 : 

WEP= 和 六 LOD*FO 


其 中 ZGD) 从 根 到 外 部 节点 i 的 路 径 长 度 ( 即 路 径 的 边 数 ); WEP 是 二 又 树 的 加 权 外 部 路 径 长 度 
(weighted external path length )。 为 了 缩短 编码 串 的 长 度 ， 必 须 使 用 二 叉 树 代码 ， 二 又 树 的 外 
部 节点 与 要 编码 的 字符 串 的 字符 对 应 ， 且 WEP 最 小 。 一 棵 二 又 树 ， 如 果 对 一 组 给 定 的 频率 ， 
其 WEP 最 小 ,那么 这 棵 二 又 树 称 为 霍 夫 曼 树 ( Huffman tree )。 

用 霍 夫 曼 编码 对 一 个 字符 串 〈 或 一 段 文本 ) 进行 编码 ， 需 要 做 的 是 : 

1 ) 确定 字符 串 的 符号 和 它们 出 现 的 频率 。 

2 ) 建立 霍 夫 曼 树 ， 其 中 外 部 节点 用 字符 串 中 的 符号 表示 ， 外 部 节点 的 权 用 相应 符号 的 频 
率 表示 。 

3 ) 沿 着 从 根 到 外 部 节点 的 路 径 遍 历 ， 取 得 每 个 符号 的 代码 。 

4 ) 用 代码 替代 字符 串 中 的 符号 。 

为 了 便于 解码 ， 需 要 保存 从 符号 到 代码 的 映射 表 或 每 个 符号 的 频率 表 。 如 果 保 存 的 是 符 
号 的 频率 表 ， 那 么 采用 方法 2 ) 可 以 重 构 霍 夫 曼 树 。 后 面 我们 将 详细 讨论 方法 2 )。 

构造 霍 夫 曼 树 的 过 程 是 ， 首 先 建 立 一 组 二 叉 树 集合 ， 每 棵 二 又 树 仅 含 一 个 外 部 节点 ， 每 
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个 外 部 节点 代表 字符 串 的 一 个 符号 ， 其 权 等 于 该 符号 的 频率 。 然 后 ， 不 断 从 集合 中 选择 两 棵 
权 最 小 的 二 又 树 ， 把 它们 合并 成 一 棵 新 的 二 叉 树 ， 合 并 方法 是 增加 一 个 根 节点 ， 把 这 两 棵 二 
又 树 分 别 作为 左右 子 树 。 新 二 又 树 的 权 是 两 棵 子 树 的 权 之 和 。 这 个 过 程 一 直 持续 到 仅 剩 下 一 
棵 树 为 止 。 

让 我 们 把 这 个 构造 方法 运用 到 一 个 实例 : 6 个 符号 为 (a，b，c，4d，e，f)， 字符 的 频率 
分 别 为 (6,2,3,3,4,9 )。 初始 的 二 又 树 集 合 如 图 12-11a 所 示 ， 方 框 外 部 的 数字 为 树 的 权重 。 
权 最 小 的 树 是 b， 可 以 和 一 个 权 次 小 的 树 合并 。 假 设 选择 树 c。 将 5 与 c 合并， 所 得 结果 如 图 
12-11b 所 示 。 根 节点 用 权 5 表示 。 从 图 12-11b 的 5 棵 树 中 选 出 两 棵 权 最 小 的 树 4 和 ee， 合并 
后 得 到 权 为 7 的 树 ， 如 图 12-1lc 所 示 。 从 图 12-11c 的 4 棵 树 中 ， 选 择 树 a 和 权 为 5 的 树 合 
并 ， 得 到 一 棵 权 为 11 的 树 。 从 图 12-11d 的 3 棵 树 中 ， 选 择 权 为 7 的 树 和 树 了 合并， 结果 为 如 
图 12-1le 所 示 的 两 棵 树 。 将 这 两 棵 树 合并 后 即 得 到 图 12-6b 所 示 的 二 又 树 ， 其 权重 为 27。 

回回 回回 回 区 
6 2 3 3 全 9 
a) 初始 的 一 组 树 









































d) 第 三 次 合并 之 后 e) 第 四 次 合并 之 后 
图 12-11 构建 一 棵 替 夫 曼 树 


定理 12-3 上 述 过 程 所 建立 的 二 又 树 是 霍 夫 曼 树 。 

证 明 留 作 练 习 (练习 41 )。 男 

构建 霍 夫 曼 树 的 过 程 可 以 利用 小 根 堆 来 实现 ， 用 小 根 堆 存 储 二 又 树 集 合 。 小 根 堆 的 每 个 
元 素 包括 一 棵 二 叉 树 和 它 的 权 ， 二 叉 树 是 在 11.8 节 所 定义 的 类 linkedBinaryTree<int> 的 一 个 
实例 。 为 了 方便 ， 我 们 假设 符号 是 整 型 ， 用 1 到 表示。 对 于 外 部 节点 ，element 域 的 值 是 
它 所 表示 的 符号 ， 对 于 内 部 节点 ，element 域 的 值 是 0。 在 程序 12-10 的 huffmanTree 函数 中 ， 
假定 模板 结构 hufftmanNode<T> 具有 类 型 为 linkedBinaryTree<int>* 的 数据 成 员 tree 和 类 型 为 
T 的 数据 成 员 weight。 我 们 还 假定 , huffmanNode<T> 定义 了 一 个 向 类 型 T 的 成 员 转 换 的 函数 ， 
它 的 返回 值 就 是 weight 域 的 值 。 

huffmanTree 函数 的 输入 是 存储 在 数组 w[l:n] 中 的 n 个 频率 ( 即 权 )， 返 回 值 是 一 
棵 霍 夫 曼 树 。 它 首先 构造 n 棵 二 叉 树 ， 每 棵 树 仅 由 一 个 外 部 节点 构成 。 这 些 二 叉 树 是 用 
linkedBinaryTree 的 方法 makeTree 构造 的 。 这 个 方法 用 指定 的 根 和 左右 子 树 来 构造 一 棵 二 又 
树 。n 棵 二 叉 树 存储 在 数组 hNode 中 ， 然 后 被 初始 化 为 一 个 小 根 堆 。 第 二 个 for 循环 的 每 一 次 


和 迭代 ， 都 从 小 根 堆 中 取出 权 最 小 的 两 棵 二 叉 树 ， 并 将 它们 合并 成 一 棵 二 又 树 ， 然 后 将 这 棵 二 
又 树 插 人 小 根 堆 。 


程序 12-10 ”构造 一 棵 霍 夫 曼 树 


template <class T> 
linkedBinaryTree<int>* huffmanTree(T weight[], int n) 
{/ 用 权 weight [1:n] 生成 霍 夫 曼 树 ，n >= 1 
/ 创建 一 组 单 节 点 树 
huffmanNode<T> *hNode = new huffmanNode<T> [n + 1]; 
linkedBinaryTree<int> emptyTree; 
£6r {EN = 荆 <= Ny t+) 
{ 
hNode[i] .weight = weight [I]7 
hNode [1i] .tree = new linkedBinaryTree<int>; 
hNode[i] .tree->makeTree (i, emptyTree, emptyTree); 
} 


/使 一 组 单 节点 树 构 成 小 根 扒 
minHeap<huffmanNode<T> > heap (1); 
heap.initialize(hNode, n); 


/不 断 从 小 根 扒 中 提取 两 个 树 合并 ， 直 到 剩 下 一 棵 树 
huffmanNode<T> w, x, y; 
linkedBinaryTree<int> *Z7 
fo (和 主 三 1 和 Tt) 
{ 

1/ 从 小 根 扒 中 取出 两 棵 最 轻 的 树 

x = heap.top(); heap.pop(); 

y = heap.top(); heap.pop(); 


1/ 合并 成 一 棵 树 
z = new linkedBinaryTree<int>; 
z->makeTree (0, *x.tree, *y.tree); 
w.weight = x.weight + y.weight; 
Ww.tree = 2z; 
heap.push (w); 
delete x.tree; 
delete y.tree; 

} 


return heap.top() .tree; 


} 


huffmanTree 函数 的 复杂 性 

创建 数组 hNode 的 时 间 是 O(n)。 第 一 个 for 循环 和 堆 的 初始 化 的 时 间 也 是 O(n)。 在 第 二 
个 for 循 环 中 ， 共 有 2(n-1) 次 的 top 操作 、2(n-1) 次 的 pop 操作 和 nn-1 次 的 push 操作 ， 时 间 
为 O(nlogn)。 其 余部 分 的 时 间 为 9(n)。 因 此 huffmanTree 函数 的 总 时 间 O(nlogn)。 


练习 


26. 对 数组 [-,5,7,2,9,3,8,6,1] 实施 堆 排 序 。 首 先 画 出 相应 的 完全 二 叉 树 ， 然 后 画 出 堆 化 的 树 ， 
接 下 来 ， 画 出 与 图 12-9 类 似 的 图 ， 显 示 每 一 次 从 大 根 堆 删除 后 的 情况 。 
27. 对 数组 [-,11,10,9,8,7,6,5,4,3,2,1] 重 做 练习 26。 
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编写 一 个 用 4 堆 ( 见 练习 17 ) 排序 的 方法 ， 对 4 的 不 同 值 ， 比 较 排 序 算法 在 最 坏 情 况 下 
的 运行 时 间 。4d 取 什 么 值 时 ， 排 序 算法 的 性 能 最 好 ? 


. 利用 练习 15 与 练习 16 的 思想 ， 实 现 一 种 比 程序 12-8 更 快 的 堆 程序 。 用 随机 数据 做 实验 ， 


比较 两 种 实现 代码 的 执行 时 间 。 

一 种 排序 算法 称 为 稳定 的 (stable )， 是 指 关 键 字 相同 的 记录 在 排序 前 后 的 顺序 相同 。 假 设 
记录 3 和 记录 10 的 关键 字 相 同 ， 在 用 一 个 稳定 排序 方法 排序 之 后 ， 记 录 3 仍 在 记录 10 的 
前 面 。 请 问 堆 排序 是 稳定 的 吗 ? 插 入 排序 是 稳定 的 吗 ? 


. 对 处 理 时 间 [6,5,3,2,9,7,1,4,8]， 男 出 三 台 机 器 的 LPT 调度 。 调 度 完成 时 间 是 多 少 ? 你 能 找 


到 一 个 调度 完成 时 间 更 短 的 调度 吗 ?” 你 的 调度 是 最 优 算法 吗 ? 


. 对 处 理 时间 [20,15,10,8,8,8]， 重 做 练习 31。 
. 在 程序 12-9 的 第 二 个 for 循环 中 ， 每 一 次 迭代 都 执行 一 次 pop 和 一 次 push 操作 。 这 两 个 


操作 使 最 小 关键 字 增 加 了 ， 所 增加 的 量 是 刚 被 调度 的 作业 所 需要 的 处 理 时 间 。 利 用 一 个 

扩充 的 最 小 优先 级 队列 ， 可 以 使 程序 12-9 的 速度 提高 一 个 常量 因子 。 这 个 扩充 的 类 不 仅 

包括 最 小 优先 级 队列 通常 具有 的 函数 ， 而 且 包 括 函 数 changeMin(x)， 后 者 把 最 小 元 素 改 为 

x。changeMin 沿 堆 向 下 移动 ( 如 同 最 小 元 素 的 删除 操作 )， 并 将 元 素 上 移 直 到 为 改变 的 元 

素 找 到 一 个 合适 的 位 置 。 

1 ) 设计 一 个 新 类 extendedMinHeap ， 它 包括 minHeap 类 的 所 有 成 员 函 数 和 changeMin 也 
数 。extendedMinHeap 应 该 从 类 minHeap 中 派生 。 类 minHeap 可 从 本 书 网 站 上 得 到 。 

2 ) 使 用 函数 changeMin 重 写 程序 12-9。 

3 ) 设计 实验 来 确定 ， 新 代码 与 程序 12-9 相 比 ， 时 间 性 能 改进 了 。 


. 构建 一 个 机 器 调度 实例 ， 使 两 台 机 器 的 LPT 调度 达到 了 程序 12-2 所 给 定 的 上 界 。 
. 对 三 台 机 器 的 LPT 调度 ， 重 做 练习 34。 
.将 n 件 物品 装 入 容器 。 第 i 件 物品 需要 的 空间 为 s;， 每 个 容器 的 容量 为 c。 装 入 过 程 采用 


最 不 合适 法 则 〈 worst-fit rule )， 每 次 给 容器 分 配 一 件 物品 。 当 一 件 物品 需要 分 配 容器 时 ， 

我 们 寻找 剩余 容量 最 大 的 容器 。 若 该 容器 可 以 装 下 这 件 物品 ， 则 将 物品 装 人 该 容器 ， 否 

则 ， 就 启用 一 个 新 容器 。 

1 ) 编写 一 个 程序 ， 输 入 为 x、s; 和 c， 和 输出 为 物品 在 容器 中 的 分 配方 案 。 利 用 大 根 堆 来 记 
录 容 器 的 可 用 空间 。 

2 ) 程序 的 复杂 性 是 多 少 ( 复杂 性 应 为 物件 个 数 n 及 容器 个 数 m 的 函数 ) ? 


. 对 一 组 权 值 [3,7,9,12,15,20,25]， 画 出 霍 夫 曼 树 。 
. 对 一 组 权 值 [2,4.5,7,9,10,14,17,18,50]， 重 做 练习 37。 
. 一 个 归并 段 (run ) 是 一 组 元 素 的 有 序 序列 。 假 定 两 个 归并 段 合 并 为 一 个 归并 段 的 时 间 为 


O(r+ts)， 其 中 + 和 s 分 别 是 这 两 个 归并 段 的 长 度 。 长 度 不 同 的 于 个 归并 段 要 合并 为 一 个 归 
并 段 ， 需 要 两 个 两 个 地 合并 ， 直 到 剩 下 一 个 归并 段 为 止 。 解 释 一 下 ， 如 何 用 霍 夫 曼 树 来 确 
定 一 个 n 个 归并 有 段 合 并 的 用 时 最 少 的 方案 。 

假设 为 一 段 含有 个 符号 的 文本 编码 。 要 设计 一 组 具有 前 缀 特性 的 代码 ， 一 个 简单 的 方法 
是 ， 从 一 个 具有 个 外 部 节点 的 右 偏 扩展 二 又 树 开始 ， 按 频率 F() 的 递减 顺序 给 n 个 符号 
排序 ， 把 符号 赋 给 外 部 节点 ， 使 得 外 部 节点 的 中 序 排 列 是 符号 按 频率 递减 顺序 的 排列 。 排 
序 步骤 用 时 O(nlogn)， 其 余 步 骤 用 时 O(n)。 因 此 ， 这 个 方法 与 12.6.3 节 的 优化 方法 具有 相 
同 的 渐 近 复杂 性 。 


1 ) 假设 n=5， 符 号 为 a ~ e， 频 率 是 [4,6,7,9,10]， 画 出 霍 夫 曼 树 和 右 偏 树 。 每 个 外 部 节点 
用 它 表 示 的 符号 来 标识 ， 列 出 符号 的 代码 ， 给 出 每 棵 树 的 WEP。 
2 ) 假设 2” 个 符号 具有 相同 的 频率 。 霍 夫 曼 树 的 WEP 和 右 偏 树 的 比率 是 多 少 ? 假定 n 是 2 
的 宕 。 
3 ) 编写 一 个 方法 ， 创 建 一 棵 如 上 所 描述 的 右 偏 扩 展 二 叉 树 。 
4) 把 3) 的 方法 和 程序 12-10 的 方法 做 实际 运行 时 间 的 比较 。 
5 ) 随机 生成 一 个 实例 ， 用 来 对 两 种 方法 产生 的 树 比较 WEP 的 差别 。 
6) 基于 2)、4) 和 5) 的 结果 ， 你 能 建议 使 用 本 练习 的 方法 要 优 于 程序 12-10 的 方法 吗 ? 
为 什么 ? 
41. 利用 外 部 节点 的 数目 对 定理 12-3 进行 归纳 证 明 。 在 归纳 步 中 可 以 假定 存在 一 棵 二 又 树 ， 
该 树 拥 有 最 小 WEP， 且 存在 一 棵 子 树 ， 子 树 中 有 一 个 内 部 节点 和 两 个 外 部 节点 ， 外 部 节 
点 分 别 对 应 两 个 最 小 频率 。 
42. 写 一 个 程序 ， 其 输入 为 huffmanTree ( 见 程序 12-10 ) 所 建立 的 霍 夫 曼 树 ， 输 出 为 编码 表 。 
程序 的 复杂 性 是 多 少 ? 
43. 设计 一 个 完整 的 基于 霍 夫 曼 编码 的 压缩 - 解压 缩 软件 包 。 测 试 你 的 代码 。 
44. 和 欲 存储 0 ~ 511 之 间 的 个 整数 ， 利 用 霍 夫 曼 编码 编写 一 个 压缩 - 解压 缩 软 件 包 来 实现 。 


12.7 参考 及 推荐 读物 


要 更 详细 地 研究 优先 级 队列 及 其 各 种 变化 ， 可 参考 E. Horowitz, S. Sahni, D. Mehta. 
Fundamentals of Data Structures in C++. W. H. Freeman, New York, NY, 1994. 

高 度 优 先 左 高 树 可 参考 专题 论文 R. Tarjan. Data structures and Network Algorithms. SIAML 
Philadephia, PA, 1983. 而 权重 优先 左 高 树 可 参考 论文 S$. Cho, S. Sahni. Weight Biased Leftist 
Trees and Modified Skip Lists. ACM Jr. on Experimental Algorithmics, Article 2, 1998. 

可 以 从 以 下 书 中 找到 更 多 的 NP- 复杂 问题 ,如 : M. Garey, D. Johnson. Computer and 
Intractability: A Guide to the Theory of NP-Completeness. W.H.Freeman, New York, NY, 1979 和 下. 
Horowitz, S$. Sahni, S. Rajasekeran. Computer Algorithms. Computer Science Press, New York, NY, 
1998. 关于 定理 12-2 的 证 明 可 参考 Computer Algorithms 一 书 第 12 章 . 
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穿越 森林 的 旅程 已 经 过 半 。 现 在 我 们 在 本 章 遇 到 的 是 新 的 树种 一 一 竞赛 树 (tournament 
tree )。 像 12.4 节 的 堆 一 样 ， 竞 赛 树 也 是 完全 二 叉 树 ， 它 可 用 11.4.1 节 的 数组 二 又 树 来 表示 ， 
而 且 存储 效率 最 高 。 竞 赛 树 的 基本 操作 是 替换 最 大 (或 最 小 ) 元 素 。 如 果 有 nn 个 元 素 , 这 个 
基本 操作 的 用 时 为 @(logmm)。 虽 然 用 堆 和 左 高 树 来 表示 也 能 用 近似 的 时 间 ( O(logn) ) 完成 这 个 
操作 ， 但 是 用 来 实现 可 预见 的 断 接 操作 都 不 容易 。 当 我 们 需要 按 指定 的 方式 断 开 连接 时 ， 比 
如 选择 最 先 插入 的 元 素 ， 或 选择 左 端 元 素 (假定 每 个 元 素 都 有 一 个 从 左 到 右 的 名 次 )， 这 时 ， 
竞赛 树 就 成 为 我 们 要 选择 的 数据 结构 。 

本 章 将 研究 两 种 竞赛 树 : 赢 者 树 和 输 者 树 。 尽 管 赢 者 树 更 直观 ， 而 且 模 拟 的 是 现实 的 竞 
赛 树 ， 但 输 者 树 的 实现 更 高 效 。 本 章 最 后 一 节 的 应 用 部 分 将 考察 男 一 种 NP- 复杂 问题 : 箱子 
装载 。 对 箱子 装载 问题 的 两 个 近似 算法 ， 都 利用 竞赛 树 来 实现 ， 很 有 效率 。 试 一 试 ， 能 否 用 
本 书 迄 今 为 止 所 介绍 的 其 他 数据 结构 以 相同 的 时 间 复 杂 性 来 实现 这 两 个 算法 ， 这 是 很 有 益 的 


13.1 赢 者 树 和 应 用 


假定 有 nn 个 选手 参加 一 次 网 球 比 赛 。 比 赛 规 则 是 “突然 死亡 法 ”( sudden-death mode ) : 
一 名 选手 只 要 输 掉 一 场 球 ， 就 被 淘汰 。 一 对 一 对 选手 比赛 ， 最 终 只 剩 下 一 个 选手 保持 不 败 。 
这 个 “幸存 者 ”就 是 比赛 赢 者 。 图 13-1 显示 了 一 次 网 球 比赛 ， 有 8 名 选手 参加 ， 从 a 到 有 h。 
这 个 比赛 用 二 又 树 来 描述 ， 每 个 外 部 节点 表示 一 名 选手 ， 每 个 内 部 节点 表示 一 场 比赛 ， 该 节 
点 的 孩子 表示 比赛 的 选手 。 在 同一 层 的 内 部 节点 代表 一 轮 比赛 ， 可 以 同时 进行 。 在 第 一 轮 比 
赛 中 ， 对 阵 的 选手 有 4 对 : a 与 bp、c 与 4、e 与 和 八 g 与 h。 每 场 比赛 的 赢 者 被 记录 在 代表 该 
场 比赛 的 内 部 节点 中 。 在 图 13-1a 中 ,第 一 轮 比赛 的 4 个 赢 者 为 bp、d、e 和 h， 其 余 4 个 选手 
被 淘汰 ; 下 一 轮 比 赛 的 对 阵 是 5 与 4、e 与 h,， 胜 者 为 b 和 e， 并 且 进 入 决赛 ; 最 后 赢 者 为 e。 
图 13-lb 给 出 5 名 选手 参加 的 比赛 ， 从 a 到 e， 最 后 的 赢 者 是 c。 








[a| [sz [el [a [ej [A {al 
a) 8 名 选手 b) 5 名 选手 


图 13-1 竞赛 树 
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图 13-1 的 两 棵 竞赛 树 都 是 完全 二 又 树 ( 实际 上 ， 树 a ) 还 是 满 二 叉 树 )， 而 现实 的 竞赛 所 
对 应 的 树 不 一 定 都 是 完全 二 又 树 。 但 是 ， 用 完全 二 又 树 可 以 使 比赛 的 场次 最 少 。 对 于 个 选 
手 的 比赛 ,最少 的 比赛 场次 为 [logyn|。 图 13-1 的 竞赛 树 称 为 赢 者 树 ( winner tree )， 因 为 每 一 
个 内 部 节点 所 记录 的 都 是 比赛 的 赢 者 。13.4 节 将 介绍 另 一 种 类 型 的 竞赛 树 一 一 输 者 树 ( loser - 
tree )， 每 一 个 内 部 节点 所 记录 的 都 是 比赛 的 输 者 。 竞 赛 树 也 称 为 选择 树 〈 selection tree )。 

为 了 便于 计算 机 的 实现 ， 我 们 把 赢 者 树 限制 为 完全 二 又 树 。 

定义 13-1[ 赢 者 树 ] 有 靖 个 选手 的 一 棵 赢 者 树 是 一 棵 完全 二 又 树 ， 它 有 于 个 外 部 节点 和 
1-] 个 内 部 节点 ， 每 个 内 部 节点 记录 的 是 在 该 节点 比赛 的 赢 者 。 

为 了 确定 一 场 比赛 的 赢 者 树 ， 我 们 假设 每 个 选手 都 有 一 个 分 数 ， 而 且 有 一 个 规则 用 来 比 
较 两 个 选手 的 分 数 以 确定 赢 者 。 在 最 小 赢 者 树 ( min winner tree ) 中 ， 分 数 小 的 选手 获胜 。 在 
最 大 赢 者 树 ( max winner tree ) 中 ， 分 数 大 的 选手 获胜 。 在 分 数 相 等 ， 即 平局 的 时 候 ， 左 孩子 
表示 的 选手 获胜 。 图 13-2a 是 一 棵 有 8 名 选手 的 最 小 赢 者 树 ， 而 图 13-2b 是 一 棵 有 5 名 选手 的 
最 大 赢 者 树 。 每 个 外 部 节点 下 面 的 数字 表示 选手 的 分 数 。 


























a) 最 小 赢 者 树 
图 13-2 赢 者 树 





赢 者 树 的 一 个 优点 在 于 ， 当 一 名 选手 的 分 数 改 变 时 ， 修 改 竞 赛 树 比较 容易 。 例 如 ， 当 
选手 4 的 分 数 由 9 改 为 1 时 ， 只 有 从 & 到 根 的 路 径 上 的 节点 所 表示 的 比赛 可 能 需要 重 赛 ， 而 
其 他 比赛 的 结果 不 受 影 响 。 有 时 ， 甚 至 连 这 种 路 径 上 的 一 些 比赛 也 不 需要 重 赛 。 例 如 ， 在 图 
13-2a 中 ， 当 b 的 分 数 从 6 改 为 5 时 ,在 其 父 节点 的 比赛 中 ,4b 仍 为 输家 ， 因 此 6 的 祖父 及 曾 
祖父 节点 所 表示 的 比赛 都 不 必 重 赛 。 

在 一 棵 个 选手 的 赢 者 树 中 ， 当 一 个 选手 的 分 数 发 生变 化 时 ， 需 要 修改 的 比赛 场次 介 
于 1 ~ rlogzn1 之 间 ， 因 此 ， 赢 者 树 的 重 构 需 耗 时 O(logn)。 此 外 ,nn 个 选手 的 赢 者 树 可 以 在 
Q@(n) 时 间 内 初始 化 ， 方 法 是 沿 着 从 叶子 到 根 的 方向 ， 在 内 部 节点 进行 n-1 场 比赛 。 也 可 以 采 
用 后 序 遍 历来 初始 化 ， 每 访问 一 个 节点 ， 就 进行 一 场 比赛 。 

例 13-1[ 排 序 ] 可 以 用 一 棵 最 小 赢 者 树 ， 用 时 @(nlogn) 对 个 元 素 排序 。 首 先 ， 用 nn 个 
元 素 代表 n 名 选手 对 说 者 树 进行 初始 化 。 关 键 字 决 定 每 场 比 赛 的 结果 ， 总 冠军 是 关键 字 最 小 
的 元 素 。 将 该 元 素 的 关键 字 改 为 最 大 值 (如 )， 使 它 赢 不 了 其 他 任何 选手 。 然 后 重 构 赢 者 
树 ， 以 反映 出 该 元 素 的 关键 字 的 变化 。 这 时 的 总 冠军 是 按 序 排 在 第 二 的 元 素 。 将 该 元 素 的 关 
键 字 改 为 ， 再 一 次 重 构 赢 者 树 。 这 时 的 总 冠军 是 按 序 排 在 第 三 的 元 素 。 以 此 类 推 ， 可 以 完 
成 n 个 元 素 的 排序 。 启 者 树 初始 化 的 用 时 为 90D)。 每 次 改变 赢 者 的 关键 字 并重 构 赢 者 树 的 用 
时 为 9(logn)， 因 为 在 从 一 个 外 部 节点 到 根 的 路 径 上 ， 所 有 的 比赛 需要 重 赛 。 赢 者 树 的 重 构 共 
需 n-1 次 。 整 个 排序 过 程 的 时 间 为 9(n+nlogn)=O@(nlogn)。 加 

例 13-2[ 初始 归并 段 的 生成 ] 到 目前 为 止 ， 本 书 所 讨论 的 排序 方法 (插入 排序 、 堆 排序 
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等 ) 都 是 内 部 排序 法 ( internal sorting method )。 这 些 方法 要 求 待 排序 的 元 素 全 部 放 人 计算 机 
内 存 。 但 是 ， 当 待 排序 的 元 素 所 需要 的 空间 超出 内 存 的 容量 时 ， 内 部 排序 法 就 需要 频繁 地 访 
问 外 部 存储 介质 ( 如 磁盘 )， 那 里 存储 着 部 分 或 全 部 待 排 的 元 素 。 这 使 得 排序 效率 大 打折 扣 。 
于 是 我 们 需要 引入 外 部 排序 法 ( extemal sorting method )。 外 部 排序 一 般 包括 两 个 步骤 : 1 ) 生 
成 一 些 初始 归并 段 (run )， 每 一 个 初始 归并 段 都 是 有 序 集 ; 2 ) 将 这 些 初 始 归并 段 合并 为 一 个 
归并 段 。 

假设 待 排序 的 记录 有 16 000 个 ， 使 用 内 部 排序 一 次 最 多 可 排序 1000 个 记录 。 在 步骤 1) 
中 ,重复 以 下 操作 16 次 ， 可 得 到 16 个 初始 归并 段 : 

输入 1000 个 记录 

用 内 部 排序 法 对 这 1000 个 记录 排序 

输出 排序 结果 ， 即 归并 段 

生成 初始 归并 段 之 后 ， 我 们 开始 合并 归并 段 ， 即 步骤 2 )。 在 这 个 步骤 中 ,我 们 进行 若干 
次 归并 。 每 一 次 归并 ， 都 是 将 最 多 上 个 归并 段 合 并 成 一 个 归并 段 ， 归 并 段 的 个 数 也 因此 降 到 
归并 前 的 Wk。 这 个 过 程 持 续 到 归并 有 段 的 个 数 等 于 1 为 止 。 

本 例 有 16 个 初始 归并 段 (如 图 13-3 所 示 )。 它 们 的 编号 分 别 为 R1，R2，…，R16。 在 第 
一 次 归并 过 程 中 ， 先 将 R1~R4 合并 为 S1， 其 长 度 为 4000 个 记录 。 然 后 将 R5~R8 合并 ， 以 此 
类 推 。 在 第 二 次 归并 过 程 中 ,将 S1~S4 合并 为 T1， 它 是 外 部 排序 的 最 终结 果 。 


CD 
(SD (62) 3 人 4 


RI R2 R3 R4 RS R6 R7 R8 R9 RI0 RIl RI2 RI3 RIi4 RIS R16 
图 13-3 16 个 初始 归并 段 的 4 路 合并 


合并 个 归并 有 段 的 简单 方法 是 : 从 个 归并 有 段 的 前 面 ， 不 断 把 关键 字 最 小 的 元 素 移 到 正 
在 生成 的 输出 归并 段 。 当 所 有 元 素 从 个 输入 归并 有 段 移 至 输出 归并 段 时 ， 合 并 过 程 就 完成 了 。 
注意 ， 在 选择 输出 归并 有 段 的 下 一 元 素 时 ， 在 内 存 中 只 需要 知道 每 个 输入 归并 有 段 的 首 元 素 的 关 
键 字 即 可 。 因 此 ， 只 要 有 足够 的 内 存 来 保存 个 关键 字 ， 就 可 以 合并 个 任意 长 度 的 归并 有 段 。 
但 是 在 实际 应 用 上 ， 我 们 要 求 每 一 次 能 输入 / 输出 很 多 元 素 ， 以 减少 输入 /输出 的 次 数 。 

在 上 列 待 排 的 16 000 个 记录 中 ， 每 个 归并 段 有 1000 个 记录 ， 而 内 存 容量 也 是 1000 个 记 
录 。 为 了 合并 前 4 个 归并 段 ， 可 将 内 存 分 为 5 个 缓冲 区 ， 每 个 缓冲 区 的 容量 为 200 个 记录 。 
前 4 个 为 输入 缓冲 区 ， 第 5 个 为 输出 缓冲 区 。 从 前 4 个 输入 归并 段 各 取 200 个 记录 放 和 人 4 个 
输入 缓冲 区 。 把 合并 的 记录 放 入 输出 缓冲 区 。 不 断 把 输入 缓冲 区 的 记录 合并 后 放 入 输出 缓冲 
区 ， 直 到 以 下 的 一 个 条 件 满足 为 止 : 

1 ) 输出 缓冲 区 已 满 。 

2 ) 某 一 输入 缓冲 区 变 空 。 

当 第 一 个 条 件 满足 时 ， 将 输出 缓冲 区 的 记录 写 人 磁盘 ， 写 完 之 后 继续 合并 。 当 前 两 个 
条 件 满足 时 ， 从 空 缓 冲 区 所 对 应 的 输入 归并 有 段 继续 读 取 记录 ， 读 取 过 程 结束 之 后 ， 继 续 合 
并 。 当 4000 个 记录 都 写 人 一 个 归并 段 S1 时 ， 前 4 个 归并 段 的 合并 过 程 结束 ( 更 详细 的 描述 
参见 E. Horowitz, S. Sahni, D. Mehta. Fundamentals of Data Structures in C++. Computer Science 
Press, New York, NY,1995, ) 
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在 归并 段 合 并 中 ， 决 定时 间 的 因素 之 一 是 在 步骤 1 ) 中 生成 的 初始 归并 段 的 个 数 。 使 用 
赢 者 树 可 以 减少 初始 归并 段 的 个 数 。 假 设 一 棵 赢 者 树 有 p 名 选手 ， 其 中 每 个 选手 是 输入 集合 
的 一 个 元 素 ， 它 有 一 个 关键 字 和 一 个 归并 段 号 。 前 p 个 元 素 的 归并 有 段 号 均 为 1。 当 两 个 选手 
进行 比赛 时 ， 归 并 有 段 号 小 的 选手 获胜 。 在 归并 有 段 号 相同 时 ， 关 键 字 小 的 选手 获胜 。 为 生成 初 
始 归 并 段 ， 重 复 地 将 总 冠军 丈 移 到 它 的 归并 号 所 对 应 的 归并 段 ， 并 用 下 一 个 输入 元 素 N 取代 
。 如 果 N 的 关键 字 大 于 等 于 WV 的 关键 字 ， 则 令 元 素 NN 的 归并 段 号 与 灰 的 相同 ， 因 为 在 抒 
之 后 把 入 输出 到 同一 个 归并 上段 不 会 影响 归并 上段 的 次 序 。 如 果 NN 的 关键 字 小 于 歼 的 关键 字 ， 则 
令 元 素 N 的 归并 有 段 号 为 丈 的 归并 段 号 加 1， 因 为 在 丈 之 后 把 X 输 出 同一 个 归并 段 将 破坏 归 
并 段 的 排序 。 

当 采 用 上 述 方法 生成 初始 归并 有 段 时 ,初始 归并 段 的 平均 长 度 约 为 2p。 当 2p 大 于 内 存 容 
量 时 ， 我 们 希望 能 得 到 更 少 的 初始 归并 段 (与 上 述 方法 相 比 )。 事 实 上 ,倘若 输入 集合 已 经 有 
序 (或 几乎 有 序 )， 则 只 需 生 成 最 后 的 归并 段 ， 这 样 可 以 跳 过 归并 有 段 的 合并 ， 即 步骤 2)。 是 

例 13-3[k 路 合并 ] 在 路 合并 ( 见 例 13-2) 中 , 大 个 归并 段 合 并 成 一 个 归并 段 。 按 照 
例 13-2 所 述 的 方法 ， 每 一 个 元 素 合 并 到 输出 归并 段 所 需 时 间 为 O( 日 ， 因 为 每 一 次 迭代 都 需 
要 在 k 个 关键 字 中 找到 最 小 值 。 因 此 ， 产 生 一 个 大 小 为 n 的 归并 有 段 所 需要 的 总 时 间 为 O(kn)。 
而 使 用 赢 者 树 可 将 这 个 时 间 缩 短 为 @(k+nlogh)。 首 先 用 @(1) 的 时 间 初 始 化 一 棵 有 大 个 选手 
的 赢 者 树 ， 这 大 个 选手 分 别 是 大 个 归并 段 的 头 元 素 。 然 后 将 赢 者 移 人 输出 归并 段 ， 并 从 相应 
的 输入 归并 段 中 取出 下 一 个 元 素 替 代 赢 者 的 位 置 。 若 该 输入 段 无 下 一 个 元 素 ， 则 用 一 个 关键 
字 值 很 大 (不妨 为 m ) 的 元 素 蔡 代 。 这 个 提取 和 车 代 赢 家 的 过 程 需要 n 次 ,一 次 需要 时 间 为 
O(logk)。 一 次 上 路 合并 的 总 时 间 为 @(k+nlogh)。 图 


练习 


1. 设 选手 为 [3,5,6,7,20,8,2,9]， 画 出 最 大 和 最 小 赢 者 树 。 当 把 20 改 为 1 时 ， 画 出 相应 的 结果 。 
如 果 从 1 到 根 的 比赛 进行 重 赛 ， 画 出 相应 的 结果 。 

2. 设 选手 为 [20,10,12,18,30,16,35,33,45,7,15,19,33,11,17,25]， 画 出 最 大 和 最 小 赢 者 树 。 当 把 17 
改 为 42 时， 画 出 相应 的 结果 。 如 果 从 42 到 根 的 比赛 进行 重 赛 ， 画 出 相应 的 结果 。 

3. 设 选手 为 [3,5,6,7,20,8,2,9,12,15,30,17]， 画 出 最 大 和 最 小 赢 者 树 。 当 把 2 改 为 11 时 ， 画 出 
相应 的 结果 。 如 果 从 11 到 根 的 比赛 进行 重 赛 ， 画 出 相应 的 结果 。 

4. 设 选手 为 [10,2,7,6,5,9,12,35,22,15,1.3,4]， 画 出 最 大 和 最 小 赢 者 树 。 当 把 9 改 为 0 时 ， 
相应 的 结果 。 如 果 从 0 到 根 的 比赛 重 赛 ， 画 出 相应 的 结果 。 

5. 1 ) 如 何 用 小 根 堆 来 替代 最 小 赢 者 树 以 生成 最 初 归并 段 ( 见 例 13-2 ) ? 产生 归并 段 的 每 一 个 

元 素 需 要 多 长 时 间 ? 

2 ) 在 此 应 用 中 ， 最 小 赢 者 树 与 堆 相 比 ， 有 哪些 优点 和 缺点 ? 

6. 1 ) 在 进行 上 路 合并 时 ( 见 例 13-3 )， 如 何 用 小 根 堆 奉 代 最 小 赢 者 树 ? 
2 ) 在 此 应 用 中 ， 最 小 赢 者 树 与 堆 相 比 ， 有 哪些 优点 和 缺点 ? 


13.2 ”抽象 数据 类 型 WinnerTree 


在 定义 抽象 数据 类 型 WinnerTree 时 ， 我 们 假设 选手 的 个 数 是 固定 的 。 也 就 是 说 ， 如 果 初 
始 化 时 的 选手 个 数 为 2， 那 么 初始 化 之 后 不 能 再 增 减 选手 。 选 手 本 身 并 不 是 赢 者 树 的 组 成 部 
分 。 组 成 赢 者 树 的 成 分 是 图 13-1 所 示 的 内 部 节点 。 因 此 ， 赢 者 树 需要 支持 的 操作 有 : 初始 化 


出 


加 
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一 棵 具有 n 名 选手 的 赢 者 树 、 返 回 启 者 、 重 新 组 织 从 选手 i 到 根 的 路 径 上 的 比赛 。ADT 13-1 
是 对 这 些 操 作 的 描述 。 


抽象 数据 类 型 WinnerTree 
{ 
实例 
完全 二 叉 树 ， 每 一 个 节点 指向 比赛 胜 者 ; 外 部 节点 表示 参赛 者 
操作 


inirialize(a): 为 数组 a 的 参赛 者 初始 化 胜 者 树 
winner(): 返回 锦标 赛 胜 者 
rePlay(i): 在 参赛 者 i 改变 之 后 重 赛 





ADT 13-1 赢 者 树 的 抽象 数据 类 型 说 明 


程序 13-1 是 抽象 类 winnerTree。 虽 然 它 没有 具体 说 明 如 何 确 定 一 场 比赛 的 赢 者 ， 但 是 
我 们 假定 ， 通 过 操作 符 <= 可 以 做 到 这 一 点 。 即 x<=y， 当 且 仅 当 在 比赛 中 选手 x 赢 了 选手 y。 
通过 重 载 操 作 符 <=， 我 们 可 以 构建 最 小 赢 者 树 、 最 大 赢 者 树 ， 等 等 。 


程序 13-1 抽象 类 winnerTree 


template<class T> 
class winnerTree 
{ 
public: 
virtual ~winnerTree() {|} 
Virtual void initialize(T *thePlayer, int theNumberOfPlayers) = 0; 
11/ 用 数组 thePlayer[1:numberOfPlayers] 生成 赢 者 树 
virtual int winner() const = 0; 
/返回 赢 者 的 索引 
virtual void rePlay(int thePLayer) = 0; 
// 在 参赛 者 thePLayer 的 分 数 变化 后 重 赛 


13.3 赢 者 树 的 实现 
13.3.1 表示 


假设 用 完全 二 叉 树 的 数组 表示 来 表示 启 者 树 。 一 棵 赢 者 树 有 n 名 选手 ， 需 要 n-l1 个 内 部 
节点 tree[1:n-1]。 选 手 (或 外 部 节点 ) 用 数组 
player[1:n] 表示 ， 因 此 tree[i] 是 数组 player 的 一 
个 索引 ， 类 型 为 nt。 在 赢 者 树 的 节点 守 对 应 比 
赛 中 ，tree[i] 代表 赢 者 。 图 13-4 给 出 了 在 有 5 t [2] 
选手 的 赢 者 树 中 ， 各 节点 与 数组 tree 和 player 
之 间 的 对 应 关系 。 人 1 be Lo 
为 实现 这 种 对 应 关系 ， 我 们 必须 能 够 确定 外 s=4 lowExt=2 
部 节点 player[j] 的 父 节点 tee[p]。 当 外 部 节点 的 Fe 
个 数 为 n 时 ， 内 部 节点 的 个 数 为 n-1。 最 底层 最 p[] = tree[] and p[] = player{] 
左 端的 内 部 节点 ， 其 编号 为 *， 且 * = ?leew-nl。 因 图 13-4” 树 与 数组 的 对 应 










offset=7 
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此 ， 最 底层 内 部 节点 的 个 数 是 n-s， 最 底层 外 部 节点 个 数 lowExt 是 这 个 数 的 2 倍 。 例 如 ， 在 
图 13-4 中 , n=5, s=4， 最 底层 最 左 端的 内 部 节点 是 tree[4]， 这 一 层 的 内 部 节点 个 数 是 n-4=1 个 。 
最 底层 外 部 节点 个 数 lowExt=2， 倒 数 第 2 层 最 左 端的 外 部 节点 号 为 lowExt+l。 令 offset =2*s-1。 
对 于 任何 一 个 外 部 节点 player[i 站 ， 其 父 节点 tree[p] 由 以 下 公式 给 出 : 
| i < lowExt (13-1) 
(i-lowExt+n—-1)/2 i> lowExt 


13.3.2 赢 者 树 的 初始 化 


为 了 初始 化 一 棵 赢 者 树 ， 我 们 从 右 孩 子 选 手 开 始 ， 进 行 他 所 参加 的 比赛 ， 而 且 逐 层 往 
上 ， 只 要 是 从 右 孩 子 上 升 到 比赛 节点 ， 就 可 以 进行 在 该 节点 的 比赛 。 为 此 ， 要 从 左 往 右 地 考 
察 右 孩 子 选 手 。 在 图 13-4 的 树 中 ， 我 们 首先 进行 选手 player[2] 参加 的 比赛 ， 然 后 进行 选手 
player[3] 参加 的 比赛 ， 最 后 进行 选手 player[5] 参加 的 比赛 。 首 先 ， 我 们 进行 选手 player[2] 参 
加 的 在 节点 tree[4] 的 比赛 。 但 是 接 下 来 ， 我 们 不 能 进行 在 上 一 层 节点 tree[2] 的 比赛 ， 因 为 
tree[4] 是 它 的 左 孩 子 。 然 后 我 们 进行 选手 player[3] 参加 的 在 节点 tree[2] 的 比赛 ， 但 是 接 下 来 
不 能 进行 在 节点 tree[1] 的 比赛 ， 因 为 tree[2] 是 它 的 左 孩子 。 最 后 我 们 进行 选手 player[5] 参加 
的 在 节点 tree[3] 的 比赛 和 在 节点 tree[1] 的 比赛 。 注 意 ， 当 在 节点 tree[i] 进行 比赛 时 ， 参 加 该 
比赛 的 选手 已 经 确定 ， 而 且 选 手 的 记录 已 经 存储 在 节点 tree[i] 的 子 节点 中 。 


13.3.3 ”重新 组 织 比赛 


当选 手 thePlayer 的 值 改 变 时 ， 在 从 外 部 节点 player[thePlayer] 到 根 tree[1] 的 路 径 上 ， 一 
部 分 或 全 部 比赛 都 需要 重 赛 。 为 简单 起 见 ， 我 们 将 该 路 径 上 的 全 部 比赛 进行 重 赛 。 实 际 上 ， 
在 例 13-1、 例 13-2 和 例 13-3 中 ， 改 变 的 只 是 赢 者 的 值 。 一 个 赢 者 的 值 改 变 了 ， 必 然 会 导致 
从 赢 者 对 应 的 外 部 节点 到 根 的 路 径 上 的 所 有 比赛 要 重 赛 。 


13.3.4 类 completeWinnerTree 


实现 赢 者 树 的 数据 结构 是 类 completeWinnerTree ( 它 的 代码 可 以 从 本 书 网 站 上 得 到 )。 
方法 winner 的 时 间 复 杂 性 是 O(1)，initialize 的 时 间 复 杂 性 是 O(n)，rePlay 的 时 间 复 杂 性 是 
O(logn)， 其 中 是 选手 个 数 。 类 的 构造 渔 数 利 用 存储 在 数组 中 的 选手 进行 启 者 树 的 初始 化 。 
它 的 复杂 性 是 O(n)。 


练习 


7. 修改 方法 completeWinnerTree<T>::rePlay， 使 得 所 进行 的 比赛 都 是 必要 的 。 特 别 是 ， 当 一 场 
比赛 的 赢 者 与 该 场 比赛 前 面 的 赢 者 相同 时 ， 就 不 用 进行 这 场 比赛 ， 前 提 是 前 面 的 赢 者 不 是 
改变 的 选手 thePlayer。 

8. 编写 一 个 排序 函数 ， 它 利用 赢 者 树 ， 按 序 重复 提取 元 素 ( 见 例 13-1 )。 

9. 编写 一 个 递归 函数 ， 用 来 初始 化 赢 者 树 ， 并 且 测试 你 的 代码 。 它 的 时 间 复 杂 性 是 多 少 ? 它 
比 completeWinnerTree<T>::initialize 更 简单 吗 ? 

10. 当选 手 的 个 数 是 2 的 寡 时 ， 编 写 一 个 简化 版 的 completeWinnerTree， 并 测试 代码 。 

11. 令 nn 是 选手 个 数 ，m 是 2 的 敌 且 大 于 等 于 的 最 小 整数 。 例 如 ， 如 果 n=14， 那 么 m=16。 
如 果 建 立 一 棵 谦 者 树 ， 它 的 选手 个 数 不 是 n， 而 是 m， 以 此 来 简化 WinnerTree 的 实现 代 
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码 。 外 部 节点 player[thePlayer] 的 父 节点 是 tree[m+thePlayer-1]/2。 注 意 ，player[n+1:m] 没 
有 定义 。 

1 ) 本 方案 与 原 方 案 相 比 ， 额 外 需要 的 空间 最 大 是 多 少 ? 

2 ) 利用 这 个 方案 ， 实 现 赢 者 树 类 。 

3 ) 测试 你 的 代码 。 

4 ) 关于 运行 时 间 ， 你 认为 你 的 实现 代码 和 教材 中 的 实现 代码 相 比 ， 相 差 很 大 吗 ? 

12. 教材 的 赢 者 树 代 码 是 复杂 的 ， 因 为 在 tree 中 ， 寻 找 在 叶子 节点 比赛 的 选手 和 寻找 在 其 余 节 
点 比赛 的 选手 ， 寻 找 的 方法 是 不 同 的 。 我 们 可 以 去 掉 这 个 不 同 点 ， 以 此 简化 代码 ， 方 法 
是 ， 把 tree 的 元 素 个 数 增加 n， 并 把 增加 的 节点 置 于 外 部 节点 ( 即 选手 节点 ) 和 比赛 节点 
之 间 。 这 样 一 来 ， 当 i < lowExt 时 ，player[ 让 的 父 节点 是 tree[i+offset]， 当 i>lowExt 时 ， 
player[i] 的 父 节 点 是 tree[i-lowExt+n-1]。player[i] 的 父 节 点 用 索引 i 初始 化 。 做 了 这 样 的 
修改 之 后 ， 在 节点 tree[i] 的 比赛 总 是 在 选手 player[tree[2*i]] 和 player[tree[2*i+1]] 之 间 进 
行 ; 1 和 i ne 
1 ) 用 这 个 方案 实现 一 棵 赢 者 树 类 。 

2 ) 测试 你 的 代码 。 
3 ) 关于 运行 时 间 ， 你 认为 改进 的 实现 代码 和 教材 中 的 实现 代码 相 比 ， 相 差 很 大 吗 ? 

13. 在 实现 completeWinnerTree 的 代码 中 , 是 奇数 的 情况 可 以 去 除 ， 方法 是 ， 当 nn 是 偶数 时 ， 
我 们 可 以 建立 一 棵 其 选手 个 数 为 m=n 的 树 ， 当 n 是 奇数 时 ， 可 以 建立 一 棵 其 选手 个 数 为 
m=n+1 的 树 。 与 教材 中 的 实现 代码 相 比 ， 这 个 方法 需要 0(1) 个 额外 空间 。 当 nn 是 奇数 时 ， 
player[m] 没有 定义 。 

1 ) 用 这 个 方法 ， 实 现 一 棵 赢 者 树 类 。 
2 ) 测试 你 的 代码 。 
3 ) 对 教材 、 练 习 11 和 本 练习 的 胜 者 树 实现 代码 ， 比 较 相 对 的 优 缺 点 。 


13.4 输 者 树 


考察 在 赢 者 树 中 的 rePlay 操作 。 在 许多 应 用 中 ( 见 例 13-1、 例 13-2 和 例 13-3 )， 只 有 在 
一 个 新 选手 替代 了 前 一 个 赢 者 之 后 ， 才 执行 这 个 操作 。 这 时 ， 在 从 赢 者 的 外 部 节点 到 根 节点 
的 路 径 上 ， 所 有 上 比赛 都 要 重新 进行 。 考 察 图 13-2a 的 最 小 赢 者 树 ， 假 设 赢 者 f 被 关键 字 为 5 的 
选手 "取代 ， 重 新 进行 的 第 一 场 比赛 是 在 e 和 了 "之 间 进 行 ， 并 且 六 获胜 ，e 在 以 前 与 1 的 比 
赛 中 是 输 者 。 赢 者 f' 在 内 部 节点 tree[3] 的 比赛 中 与 g 对 阵 ， 注 意 & 在 tree[3] 处 与 1 的 前 一 场 
比赛 中 是 输 者 ， 现 在 g 与 tree[3] 处 六 对 阵 是 赢 者 。 接 下 来 ，g 在 根 节点 的 比赛 中 与 a 对阵 ， 
而 a 在 根 节点 处 的 上 一 场 比赛 中 是 输 者 。 

如 果 每 个 内 部 节点 记录 的 是 在 该 节点 比赛 的 输 者 而 不 是 赢 者 ， 那 么 当 赢 者 player[i] 改 
变 后 ， 在 从 该 节点 到 根 的 路 径 上 ， 重 新 确定 每 一 场 比赛 的 选手 所 需要 的 操作 量 就 可 以 减 
少 。 最终 的 赢 者 可 记录 在 tree[0] 中 。 图 13-5a 是 与 图 13-2a 相对 应 的 输 者 树 ， 它 有 8 名 选 
手 。 当 说 者 /的 关键 字 变 成 5 时， 我 们 移动 到 它 的 父 节点 tree[6] 进行 比赛 ， 比 赛 的 选手 是 
player[tree[6]] 和 player[6]。 也 就 是 说 ， 为 确定 选手 f'=player[6] 的 对 手 ， 只 需 简单 地 查看 
tree[6] 即 可 ， 而 在 赢 者 树 中 ， 还 需要 查看 tree[6] 的 其 他 子 节点 。 在 tree[6] 的 比赛 完成 后 ， 输 
者 。 被 记录 在 此 节点 ,了 "继续 在 tree[3] 比赛 ， 对 手 是 前 一 场 的 输 者 g， 而 g 就 记录 在 tree[3] 
中 。 这 次 的 输 者 是 性 ， 它 被 记录 于 tree[3]。 赢 者 8 则 继续 在 tree[1] 比赛 ， 对 手 是 上 一 场 比 
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赛 的 输 者 a， 而 a 就 记录 在 tree[1]。 这 次 的 输 者 是 &， 它 被 记录 在 tree[1]。 新 的 输 者 树 如 
图 13-5b 所 示 。 











b) player[6] 改 变 后 
图 13-5 8 个 选手 的 最 小 输 者 树 


当 一 个 赢 者 发 生变 化 时 ， 使 用 输 者 树 可 以 简化 重 赛 的 过 程 ， 但 是 ， 当 其 他 选手 发 生 改 
变 时 ， 就 不 是 那么 回 事 了 。 例 如 ， 当 选手 4d 的 关键 字 由 9 变 为 3 时 ， 在 tree[5]、tree[2] 和 
tree[1] 上 的 比赛 将 重新 进行 。 在 tree[5] 的 比赛 中 , 4 的 对 手 是 c， 但 < 不 是 上 一 场 比赛 的 输 者 ， 
因此 它 没有 记录 在 tree[5] 中 。 在 tree[2] 的 比赛 中 ，d 的 对 手 是 a, 但 a 也 不 是 上 一 场 比 赛 的 
输 者 。 在 tree[1] 的 比赛 中 ，4 的 对 手 是 了 ,但 同样 不 是 上 一 场 比赛 的 输 者 。 为 了 重新 进行 这 
些 比赛 ,还 得 用 到 说 者 树 。 因 此 ， 仪 当 player[] 为 前 次 比赛 的 赢家 时 ， 对 于 函数 rePlay(D， 
采用 输 者 树 比 采用 赢 者 树 执行 效率 更 高 。 


练习 


14. 设 选手 为 [3,5,6,7,20,8,2,9]， 画 出 最 大 和 最 小 输 者 树 。 当 最 大 输 者 树 的 20 改 为 10， 最 小 输 
者 树 的 2 改 为 4 时 ， 画 出 改变 后 的 树 。 在 从 改变 的 元 素 到 根 的 路 径 上 ， 所 有 的 比赛 重新 进 
行 ， 画 出 新 的 树 。 

15. 设 选手 为 [20,10,12,18,30,16,35,33,45,7,15,19,33,11,17,25]， 画 出 最 大 和 最 小 输 者 树 。 当 最 
大 输 者 树 的 45 改 为 34， 最 小 输 者 树 的 7 改 为 12 时 ， 画 出 改变 后 的 树 。 在 从 改变 的 元 素 
到 根 的 路 径 上 ， 所 有 的 比赛 重新 进行 ， 画 出 新 的 树 。 

16. 设 选手 为 [20,10,12,14,9,11,30,33,25,7,15]， 画 出 最 大 和 最 小 输 者 树 。 当 最 大 输 者 树 的 33 改 
为 5， 最 小 输 者 树 的 7 改 为 16 时 ， 画 出 改变 后 的 树 。 在 从 改变 的 元 素 到 根 的 路 径 上 ， 所 
有 的 比赛 重新 进行 ， 画 出 新 的 树 。 

17. 设 选手 为 [3,5,6,7,20,8,2,9,12,15,30,17]， 画 出 最 大 和 最 小 输 者 树 。 当 最 大 输 者 树 的 30 改 为 
19， 最 小 输 者 树 的 2 改 为 14 时， 画 出 改变 后 的 树 。 在 从 改变 的 元 素 到 根 的 路 径 上 ， 所 有 
的 比赛 重新 进行 ， 画 出 新 的 树 。 

18. 设 选手 为 [10,2,7,6,5,9,12,35,22,15,1,3,4]， 画 出 最 大 和 最 小 输 者 树 。 当 最 大 输 者 树 的 35 改 
为 8， 最 小 输 者 树 的 1 改 为 11 时 ， 画 出 改变 后 的 树 。 在 从 改变 的 元 素 到 根 的 路 径 上 ， 所 
有 比赛 重新 进行 ， 画 出 新 的 树 。 

19. 1 ) 设计 一 个 C++ 类 completeLoserTree ， 表 示 方 法 与 13.3 节 赢 者 树 类 似 。 比 赛 赢 者 记录 在 

tree[0] 中 。 定 义 公 有 方法 rePlay() 代替 原来 的 公有 方法 rePlay(i， 该 函数 从 上 一 次 比赛 
的 赢 者 开始 重新 组 织 比赛 。 
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2 ) 输 者 树 的 初始 化 有 一 个 简单 方法 ， 先 构造 一 棵 赢 者 树 ， 然 后 从 上 到 下 按 层次 遍历 ， 把 
每 个 内 部 节点 的 赢 者 替换 为 输 者 。 从 tree[i] 的 孩子 可 以 知道 在 tree[i] 处 比赛 的 选手 ， 
由 此 信息 确定 谁 是 输 者 。 采 用 上 述 策略 编写 一 个 初始 化 函数 initialize。 证 明代 码 能 在 
O(n) 的 时 间 内 对 n 个 选手 的 输 者 树 进行 初始 化 。 
3 ) 编写 一 个 递归 的 初始 化 函数 initialize。 时 间 复 杂 性 应 为 O(n)。 
4 ) 编写 一 个 初始 化 函数 initialize， 编 写 的 策略 是 : 从 最 左边 的 比赛 节点 开始 ， 它 的 左右 
孩子 都 是 选手 ; 尽 可 能 地 举行 从 此 节点 到 根 的 所 有 比赛 ， 并 记录 下 输 者 ; 当 某 一 场 比 
赛 因 为 某 一 选手 未 知 而 无 法 进行 时 ， 记 录 下 唯一 的 选手 。 重 复 这 个 过 程 ， 直 到 所 有 上 比 
赛 完成 。 证 明 你 的 代码 初始 化 一 棵 n 个 选手 的 输 者 树 用 时 为 O(n)。 
20. 设计 一 个 C++ 类 fullLoserTree， 以 实现 输 者 树 ， 而 且 如 练习 11 所 描述 的 一 样 ， 是 一 棵 满 
二 叉 树 。 参 看 练习 19 的 初始 化 策略 。 测 试 你 的 代码 。 
21. 使 用 练习 12 的 策略 ， 设 计 一 个 C++ 类 completeLoserTree2， 以 实现 输 者 树 。 参 看 练习 19 
的 初始 化 策略 。 测 试 你 的 代码 。 
22. 编写 一 个 排序 程序 ， 利 用 输 者 树 不 断 地 将 元 素 按 序 提取 出 来 。 指 出 程序 的 复杂 性 。 


13.5 应 用 
13.5.1 用 最 先 适 配 法 求解 箱子 装载 问题 


1. 问题 描述 

在 箱子 装载 问题 中 ， 箱 子 的 数量 不 限 ， 每 个 箱子 的 容量 为 binCapacity， 待 装 箱 的 物品 
有 nn 个。 物品 i 需要 占用 的 箱子 容量 为 objectSize[i]，0 < objectSize[i] < binCapacity。 所 请 
可 行 装载 ( feasible packing )， 是 指 所 有 物品 都 装 入 箱子 而 不 游 出 。 所 谓 最 优 装 载 ( optimal 
packing ) 是 指使 用 箱子 最 少 的 可 行 装载 。 

例 13-4[ 卡车 装载 ] 某 一 运输 公司 需 把 包 庄 装 和 人 卡车 中 ， 每 个 包 庄 都 有 一 定 的 重量 ,每 
辆 卡车 都 有 载重 限制 ( 假设 每 辆 卡车 的 载重 都 一 样 )。 如 何 用 最 少 的 卡车 装载 包 庄 ， 这 是 卡车 
装载 问题 。 这 个 问题 可 以 转化 为 箱子 装载 问题 ， 卡 车 对 应 箱子 ， 包 庄 对 应 物品 。 加 

例 13-5[ 集成 片 分 布 ] 把 一 组 电路 集成 片 按 行 布设 在 宽度 一 定 的 电路 板 上 。 集 成 片 高 度 
一 致 但 宽度 各 不 相同 。 要 使 电路 板 的 高 度 最 小 ， 因 而 面积 最 小 ， 占 用 的 行 数 就 要 最 少 。 和 集成 
片 分 布 问题 也 可 转化 为 箱子 装载 问题 ， 即 电路 板 的 每 一 行 对 应 一 个 箱子 ， 每 个 集成 片 对 应 一 
件 物品 。 电 路 板 的 宽度 对 应 箱子 容量 ， 而 集成 片 的 宽度 相当 于 物品 的 容量 。 画 

2. 近似 算法 

箱子 装载 问题 和 机 器 调度 问题 ( 见 12.6.2 节 ) 一 样 ， 是 NP- 复杂 问题 ， 因 此 常用 近似 算 
法 求解 。 求 解 所 得 的 箱子 数 不 是 最 少 ， 但 接近 最 少 。 有 4 种 流行 的 近似 算法 : 

1 ) 最 先 适 配 法 ( First Fit，FF )。 物 品 按 1，2，…，n 的 顺序 装 人 箱子 。 假 设 箱子 从 左 至 
右 排列 。 每 一 物品 i 放 人 可 装载 它 的 最 左面 的 箱子 。 

2) 最 优 适 配 法 (Best Fit，BF )。 令 bin[j].unusedCapacity 为 箱子 j 的 可 用 容量 。 初 始 
时 ， 所 有 箱子 的 可 用 容量 为 binCapacity。 物品 i 放 入 可 用 容量 unusedCapacity 最 小 但 不 小 于 
objectSize[i] 的 箱子 。 

3 ) 最 先 适 配 递 减法 (First Fit Decreasing，FFD )。 此 方法 与 FF 类 似 ， 区 别 在 于 ， 所 有 物 
品 首先 按 所 需 容量 的 递减 次 序 排列 ， 即 对 于 1 < icn， 有 objectSize[i] objectSize[i+1]。 
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4 ) 最 优 适 配 递减 法 (Best Fit Decreasing，BFD )。 此 法 与 BF 相似 ， 区 别 在 于 ， 所 有 物 
品 首先 按 所 需 容量 的 递减 的 次 序 排列 ， 即 对 于 1 < i<n， 有 objectSize[i] 宇 objectSize[i+1]。 

你 可 以 证 明 ， 在 以 上 4 种 方法 中 ， 没 有 一 种 是 最 优 装载 。 但 这 4 种 方法 都 很 直观 实 
用 。 在 第 12 章 练习 36 中 ， 我 们 研究 了 最 差 适 配 法 (worst-fit )。 我 们 还 可 以 研究 最 后 适 配 法 
( last-fit )、 最 后 适 配 递 减法 ( last-fit decreasing ) 和 最 差 适 配 递 减法 ( worst-fit decreasing )。 

定理 13-1 设 1 为 箱子 装载 问题 的 任 一 实例 ，b(J) 为 最 优 装 载 所 用 的 箱子 数 。FF 和 BF 
所 用 的 箱子 数 不 会 超过 (17/10)b(D+2， 而 FFD 和 BFD 所 用 的 箱子 数 不 会 超过 (11/9)b(D+4。 

例 13-6 有 4 件 物品 ， 所 需 容量 分 别 为 objectSize[1:4]=[3,5,2,4]， 把 它们 放 入 容量 为 7 
的 一 组 箱子 中 。 当 使 用 FF 法 时 ， 物 品 1 放 人 箱子 1 ; 物品 2 放 入 箱子 2。 因 为 箱子 1 是 可 容 
纳 物品 3 的 最 左面 的 箱子 ， 所 以 物品 3 放 人 箱子 1。 物 品 4 无 法 再 放 人 前 面 用 过 的 两 个 箱子 ， 
因此 使 用 了 一 个 新 箱子 。 最 后 共用 了 三 个 箱子 : 物品 1 和 3 放 入 箱子 1 ; 物品 2 放 人 箱子 2 ; 
物品 4 放 入 箱子 3。 

当 使 用 BF 法 时 ， 物 品 1 和 2 分别 放 入 箱子 1 和 箱子 2。 物 品 3 放 入 箱子 2， 这 比 放 和 信箱 
子 1 更 能 充分 利用 空间 。 物 品 4 放 人 箱子 1 正好 用 完了 空间 。 这 种 装载 方案 只 用 了 两 个 箱子 : 
物品 1 和 4 放 入 箱子 1; 物品 2 和 3 放 入 箱子 2。 

如 果 使 用 FFD 和 BFD 方法 ， 物 品 按 2、4、1、3 排序 。 最 后 结果 一 样 : 物品 2 和 3 放 人 
箱子 1; 物品 1 和 4 放 入 箱子 2。 国 

3. 最 先 适 配 法 和 赢 者 树 

赢 者 树 可 用 来 实现 FF 和 FFD 算法 ， 所 需 时 间 为 O(nlogn)。 因 为 最 多 用 到 个 箱子 ， 所 
以 从 n 个 空 箱 子 开始 。 初 始 化 时 ， 对 于 所 有 nn 个 箱子 ，bin[j].unusedCapacity=binCapacity。 
接 下 来 ， 用 bin[j] 作 为 选手 ， 对 最 大 说 者 树 进行 初始 化 。 图 13-6a 给 出 了 在 n=8 和 
binCapacity=10 条 件 下 的 最 大 赢 者 树 。 外 部 节点 从 左 到 右 分 别 对 应 箱子 1 至 8。 在 外 部 
节点 下 面 的 数字 为 箱子 的 装载 容量 。 假 定 物品 1 的 大 小 为 objectSize[1]=8。 为 找到 可 
以 装载 物品 1 的 最 左面 的 箱子 ， 我 们 从 根 tree[1] 开始 搜 索 。 根 据 一 开始 的 问题 描述 可 
知 ，bin[tree[1]].unusedCapacity = objectSize[1]， 也 就 是 说 ， 至 少 有 一 个 箱子 可 以 装载 物 
品 1。 为 找到 最 左面 的 这 个 箱子 ， 我 们 先 要 在 箱子 1~4 中 搜索 。 这 个 箱子 在 箱子 1~4 中 存 
在 ， 当 且 仅 当 bin[tree[2]].unusedCapacity 三 objectSize[1]。 在 本 例 中 此 条 件 满 足 ， 于 是 我 
们 从 根 为 tree[2] 的 子 树 开始 继续 搜索 。 先 搜索 tree[2] 的 左 子 树 ， 即 根 为 tree[4] 的 子 树 ， 
确定 是 否 存在 这 个 箱子 。 若 存在 ， 则 不 必 考 虑 tree[2] 的 右 子 树 。 在 本 例 中 ，bin[tree[4]]. 
unusedCapacity 宇 objectSize[1]， 因 此 移 到 左 子 树 。 因 为 tree[4] 的 左 子 树 是 一 个 外 部 节点 ， 
所 以 可 以 将 物品 1 放 入 节点 tree[4] 的 任 一 个 孩子 之 中 。 而 且 ， 若 左 孩子 有 足够 的 空间 ， 就 
将 物品 1 放 人 左 孩 子 。 当 物品 1 放 人 箱子 1 之 后 ,bin[1].unusedCapacity 减 为 2， 然 后 从 
bin[1] 开始 重新 比赛 。 新 的 赢 者 树 如 图 13-6b 所 示 。 现 假设 物品 2 的 大 小 objectSize[2]=6。 由 
bin[tree[2]].unusedCapacity 三 6， 可知 在 tree[1] 的 左 子 树 中 有 一 个 箱子 可 以 装载 物品 2， 因 此 
我 们 移 到 节点 tree[2]， 然 后 再 移 到 tree[2] 的 左 子 树 tree[4]， 并 将 物品 2 放 入 箱子 2。 新 的 赢 
者 树 如 图 13-6c 所 示 。 

当 物 品 3 的 大 小 objectSize[3]=5 时， 搜寻 进入 根 为 tree[2] 的 子 树 。 对 其 左 子 树 ， 
bin[tree[4]].unusedCapacity<objectSize[3]， 故 左 子 树 tree[4] 中 不 存在 能 够 容纳 物品 3 的 箱子 。 
然后 我 们 移 到 右 子 树 tree[5]， 并 将 物品 3 放 人 箱子 3。 调 整 后 的 赢 者 树 如 图 13-6d 所 示 。 接 
下 来 ， 假设 物品 4 的 大 小 objectSize[4]=3。 搜 索 进 入 根 为 tree[4] 的 子 树 ， 因 为 bin[tree[4]]. 
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unusedCapacity 三 objectSize[4]， 所 以 将 物品 4 加 入 箱子 2。 















| | 
10 10 10 10 10 10 10 10 2 10 10 10 10 10 10 10 
a) 初始 时 b) s[1] 装 载 后 





2 4 10 10 10 10 10 10 2 .45 1010101010 
c) s[2] 装 载 后 d) s[3] 装 载 后 


图 13-6， 用 于 最 先 适 配 法 的 最 大 赢 者 树 


4. 最 先 适 配 法 的 C++ 实现 
首先 我 们 给 类 completeWinnerTree 增加 一 个 公有 方法 : 


int winner (int i)const 
{return (i<numberOfPlayer) ?tree[i]:0;1 


这 个 方法 的 返回 值 是 在 内 部 节点 i 的 比赛 中 获胜 者 。 

程序 13-2 的 函数 firstFitPack 实现 最 先 适 配 策略 。 它 假定 物品 的 个 数 至 少 是 2， 而 且 每 一 
件 物品 的 大 小 binCapacity。 这 个 条 件 由 主 函数 来 保证 ， 它 输入 箱子 容量 和 物品 大 小 ， 然 后 
调用 firstFitPack。 

函数 firstFitPack 利用 了 数据 类 型 binType， 这 个 类 型 只 有 一 个 数据 成 员 unusedCapacity。 
这 个 类 型 重 载 了 操作 符 <=， 使 得 表达 式 x<=y 的 值 为 真 ， 当 且 仅 当 x. unusedCapacity 
y. unusedCapacity。 

函数 firstFitPack 首先 对 n 名 选手 的 最 大 说 者 树 进行 初始 化 ， 其 中 是 箱子 个 数 。 选 手 i 
代表 箱子 i 当前 的 容量 。 所 有 箱子 的 初始 容量 为 binCapacity。 该 函数 假定 ， 除 非 右边 选手 大 
于 左边 选手 ， 和 否则 左边 选手 是 赢 者 。 

在 第 二 个 for 循环 中 ， 物 品 被 依次 放置 到 各 箱子 中 。 在 放置 物品 的 过 程 中 ， 我 们 从 根 节 
点 开始 ， 沿 着 一 条 路 径 去 寻找 能 够 装载 该 物品 的 最 左面 的 箱子 。 我 们 从 当前 节点 来 判断 ， 它 
的 左 子 树 〈 它 的 根 是 child ) 是 否 包含 这 个 箱子 ， 如 果 没 有 ， 则 右 子 树 ( 它 的 根 是 child+1 ) 一 
” 定 包 含 了 这 个 箱子 。 为 找到 这 个 箱子 ， 我 们 要 优先 考虑 左 子 树 。 若 当前 节点 的 左 子 树 是 一 外 
部 节点 ( 即 child nn)， 则 while 循环 结束 。 注 意 ， 我们 的 代码 不 能 显 式 地 记录 当前 节点 位 
置 ， 而 是 在 退出 while 循环 时 ， 用 child 除 以 2 来 计算 当前 节点 位 置 。 当 为 奇数 时 ， 当 前 
节点 可 能 是 一 个 外 部 节点 ， 这 时 child 等 于 n。 在 其 他 情况 下 ，child 均 为 内 部 节点 。 当 child 
为 外 部 节点 时 ， 该 节点 对 应 的 箱子 便 是 在 其 父 节 点 的 比赛 中 获胜 者 ， 也 就 是 说 。 它 是 箱子 
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tree[child/2]。 当 child 为 内 部 节点 时 ， 可 以 确信 tree[child] 有 足够 容量 。 然 而 ， 倘 若 该 箱子 不 
是 其 父 节点 的 左 孩 子 ， 它 可 能 不 是 最 左面 的 箱子 ， 故 我 们 从 该 箱子 的 左边 进行 检查 。 一 旦 确 
定 了 用 箱子 binToUse 来 装载 物品 1， 该 箱子 的 可 用 容量 应 减少 objectSize[i] ， 然 后 沿 着 从 该 箱 
子 到 根 的 路 径 ， 重 新 进行 其 中 的 比赛 。 

在 程序 13-2 的 第 二 个 for 循环 中 ， 每 次 迭代 需 耗 时 B(logn)， 其 中 是 物品 数量 。 因 此 ， 
该 循环 共 需 耗 时 @(nlogm)。 该 函数 其 余部 分 所 需 时 间 为 O(00)， 于 是 总 耗 时 为 O(nlogn)。 


程序 13-2 ”函数 firstFitPack 


void firstFitPack (int *objectSize, int numberOfObjects, int binCapacity) 
{// 输出 箱子 容量 为 binCapacity 的 最 先 适 配 装载 
WobjectSize[1:numberOfobjects] 是 物品 大 小 


int n = numberOfObjects; 1/ 物品 数量 


1/ 初始 化 n 个 箱子 和 说 者 树 
binType *bin = new binType [n + 1]; 1/ 箱子 
EOE (int i 一 1 4 <= ni T++) 

bin[i] .unusedCapacity = binCapacity; 
completeWinnerTree<binType> winTree (bin, n); 


/将 物品 装 到 箱子 里 
for (int 工 1; 1 <= ny IT4+) 
{// 把 物品 工装 入 一 个 箱子 
// 找到 第 一 个 有 足够 容量 的 箱子 
int child = 2; /从 根 的 左 孩 子 开始 搜索 
while (child < n) 
int winner = winTree.winner (child); 
if (bin[winner] .unusedCapacity < objectSize[i]) 


child++ : /第 一 个 箱子 在 右 子 树 
child *= 2; // 移 到 左 孩 子 
} 
int binToUse; /设置 为 要 使 用 的 箱子 
child /= 2; 1/ 撤销 向 最 后 的 左 孩 子 的 移动 
if (child < n) 
{// 在 一 个 树 节点 


binToUse = winTree.winner (child); 
1// 车 binToUse 是 右 孩 子 ， 则 要 检查 箱子 binToUse-1 
1/ 即使 binToUse 是 左 孩 子 ， 检 查 箱子 binToUse-1 也 不 会 有 问题 
if (binToUse > 1 && bin[binToUse - 1] .unusedCapacity >= objectSize[i]) 
binToUse--; 
} 
else // 当 n 是 奇数 
binToUse = winTree.winner (child / 2); 


cout << "Pack object " << i <<" in bin " 

<< binToUse << endl; 
bin[binToUse] .unusedCapacity -= objectSize[i]; 
winTree.rePlay (binToUse); 


5. 评价 

函数 firstFitPack 直接 使 用 了 赢 者 树 实现 方法 的 技术 细节 。 例 如 ， 赢 者 树 是 用 数组 表示 的 
完全 二 又 树 ， 它 能 够 按照 数组 下 标 乘 2 或 加 1 的 方式 从 上 向 下 移动 。 这 种 向 下 移动 方式 没有 
实现 类 的 一 个 目标 一 一 信息 隐藏 。 我 们 希望 类 的 实现 细节 对 用 户 是 不 可 见 的 ， 这样 的 话 ， 我 
们 就 可 以 在 不 改变 类 的 公有 成 员 的 情况 下 修改 类 的 具体 实现 细节 ， 而 且 修 改 后 的 结果 不 会 影 
响应 用 代码 的 正确 性 。 利 用 信息 隐藏 的 好 人 处， 我 们 可 以 在 类 completeWinnerTree 中 增加 方法 ， 
使 得 用 户 可 以 从 一 个 内 部 节点 移动 到 它 的 左 孩子 和 右 孩 子 ， 然 后 在 函数 firstFitPack 中 应 用 这 
些 方法 。 


13.5.2 ”用 相 邻 适 配 法 求解 箱子 装载 问题 


1. 何谓 相 邻 适 配 法 

相 邻 适 配 法 是 一 种 箱子 装载 策略 : 为 装载 一 件 物品 ， 首 先 在 非 空 的 箱子 中 循环 搜索 能 够 
装载 该 物品 的 箱子 ， 如 果 找 不 到 这 样 的 箱子 ， 就 启用 一 个 空 箱子 。 开 始 时 ， 没 有 非 空 的 箱子 ， 
因此 ， 为 装载 物品 1， 启 用 箱子 1。 假 设 箱子 1~ 箱子 b 已 经 装 有 物品 ， 我 们 把 这 些 箱子 想象 
成 一 个 环 : 当 i 关 b 时 ，i 的 下 一 个 箱子 为 寺 1; 当 i=b 时 ，i 的 下 一 个 箱子 为 箱子 1。 要 装载 当 
前 的 一 件 物品 ， 假 设 上 一 件 物品 已 装 入 箱子 。 我 们 从 箱子 开始 循环 查找 非 空 的 箱子 ， 如 果 找 
到 合适 的 箱子 ， 就 把 物品 放 进 这 个 箱子 ， 如 果 回 到 箱子 j 还 没有 找到 合适 的 箱子 ， 则 启用 一 
空 箱子 ， 并 将 物品 放 人 这 个 空 箱子 。 

例 13-7 有 6 件 物品 objectSize[1:6]=[3,5,3,4,2,1] 要 放 入 容量 为 7 的 箱子 中 。 用 相 邻 适 配 
装载 法 ， 首 先 将 物品 1 放 人 箱子 1。 对 物品 2， 无 合适 的 非 空 箱子 ， 故 启用 一 个 空 箱子 一 一 箱 
子 2。 对 于 物品 3， 从 下 一 个 箱子 开始 搜寻 非 空 的 合适 箱子 。 上 一 次 使 用 的 箱子 为 箱子 2， 故 
下 一 个 箱子 为 箱子 1。 箱 子 1 有 足够 的 空间 ， 因 此 将 物品 3 放 人 箱子 1。 对 于 物品 4， 因 为 箱 
子 1 是 上 一 次 使 用 的 箱子 ， 所 以 从 箱子 2 开始 查找 。 箱 子 2 无 足够 的 空间 ， 而 箱子 2 的 下 一 
个 箱子 (箱子 1 ) 也 无 足够 的 空间 ， 因 此 启动 新 箱子 一 一 箱子 3。 装载 物品 $ 的 过 程 是 从 查寻 
箱子 3 的 下 一 个 箱子 开始 的 ， 箱 子 3 的 下 一 个 箱子 为 箱子 1， 按 上 述 步骤 ， 可 查 知 箱子 2 是 
合适 的 ， 因 此 将 物品 5 放 人 箱子 2。 对 于 最 后 一 个 物品 6， 从 箱子 3 开始 检查 ， 因 该 箱子 有 足 
够 空间 ， 可 将 物品 6 放 人 其 中 。 加 

相 邻 适 配 策略 与 另 一 种 同名 的 动态 存储 分 配 策略 很 类 似 ， 如 果 和 箱子 装载 联系 起 来 ， 这 
是 另 一 种 相 邻 适 配 策略 : 每 次 装载 一 个 物品 ， 若 一 个 物品 不 能 装 人 当前 箱子 ， 则 将 当前 箱子 
关闭 并 启用 一 个 新 的 箱子 。 本 节 不 考虑 这 种 适 配 策略 。 

2. 相 邻 适 配 法 和 赢 者 树 

可 用 最 大 赢 者 树 来 高 效 地 实现 相 邻 适 配 策略 。 与 最 先 适 配 法 一 样 ， 外 部 节点 代表 箱子 ， 
在 比赛 中 比较 的 是 箱子 的 可 用 容量 大 小 。 对 于 n 件 物 品 的 装载 问题 ， 从 na 个 箱子 (外 部 节点 ) 
开始 。 观 察 图 13-7 的 最 大 赢 者 树 ， 其 中 有 6/8 的 箱子 已 被 使 用 ， 其 中 的 标号 或 数字 约定 和 
图 13-6 的 一 样 。 虽 然 当 n=8 时 ， 图 13-7 所 示 的 情况 不 会 出 现 ， 但 可 以 用 来 说 明 实现 相 邻 适 
配 策略 的 过 程 。 若 上 一 件 物品 被 放 人 箱子 lastBinUsed 中 且 当 前 已 使 用 了 bb 个 箱子 ， 则 按 如 下 
两 个 步骤 来 搜索 下 一 个 可 用 的 箱子 : 

1 ) 在 编号 大 于 lastBinUsed 的 箱子 中 ， 找 到 第 一 个 合适 的 箱子 j。 当 箱子 总 数 为 n 时 ， 这 
样 的 j 总 存在 。 若 该 箱子 非 空 ( 即 j < b )， 则 将 物品 放 人 该 箱子 。 

2 ) 若 步 又 1 未 找到 一 个 非 空 的 箱子 ， 则 在 树 中 搜索 适合 该 物品 的 最 左面 的 箱子 ， 然 后 将 
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物品 放 入 该 箱子 。 

现在 来 考察 图 13-7 的 情形 ， 而 且 假 设 下 一 个 物品 的 
大 小 为 7。 若 lastBinUsed=3， 则 在 步骤 1 中 确定 箱子 5 
有 足够 的 空间 。 因 为 箱子 5 是 非 空 箱子 ， 所 以 可 将 物品 
放 和 人 其 中 。 若 lastBinUsed=5， 则 由 步骤 1 获知 箱子 7 有 
足够 空间 。 因 为 箱子 7 是 空 箱子 ， 所 以 移 到 步骤 2， 找 pi i pi 
到 合适 的 最 左面 的 箱子 1， 将 物品 放 入 其 中 。 743535683 1010 

为 了 实现 步 又 1， 我们 从 箱子 j=lastBinUsed+1 开 图 13-7 用 于 相 邻 适 配 法 的 最 大 赢 者 树 
始 。 若 lastBinUsed=n， 则 所 有 n 个 物品 都 已 装 箱 ， 并 且 
用 了 n 个 箱子 ， 每 件 物品 一 个 箱子 。 因 此 j < n。 图 13-8 的 伪 码 描述 了 从 箱子 j 开始 查找 合适 
的 箱子 的 过 程 。 沿 着 从 箱子 j 到 根 的 路 径 进行 遍历 ， 依 次 查看 右 子 树 ， 直 至 找到 第 一 棵 包含 
这 种 箱子 的 右 子 树 为 止 。 这 时 ， 在 该 子 树 中 ， 能 够 容纳 物品 的 最 左面 的 箱子 就 是 所 要 查找 的 
箱子 。 








// 寻找 离 lastBinUsed 右面 最 近 的 适合 物品 i 的 箱子 

j = lastBinUsed+1; 

if (bin[j] .unusedCapacity>=objectSize[i]) 
retiurn J 

if (bin[j+1] .unusedCapacity>=objectSize[i]) 
return j+1;} 


p=bin[i] 的 双亲 
if (p==n-1) 
{1/ 特殊 情况 
令 q 等 于 tree[p] 右 端的 外 部 节点 
if(bin[gq] .unusedCapacity>=objectSize[i]) 
return dg? 


} 


1/ 向 根 方向 移动 ， 寻 找 第 一 个 右 子 树 ， 它 有 一 个 容量 足够 的 箱子 。P 右面 的 子 树 是 p+1 
P/=2;7 // 移动 到 父 节点 
while(bin[tree[p+1]].unusedCapacity<objectSize[i]) 

P/=2: 





return 在 子 树 p+1 中 适合 物品 的 第 一 个 箱子 
图 13-8 步骤 1 的 伪 码 


考察 图 13-7 的 赢 者 树 。 假 设 lastBinUsed=1 且 objectSize[i]=7。 从 j=2 开始 ， 首 先 可 以 
确定 箱子 2 无 足够 的 容量 。 接 着 ， 查 询 箱子 j+1=3， 它 也 没有 足够 的 容量 。 因 此 移 到 j 的 
父 节点 并 取 p 等 于 4。 因 p 关 n-1， 我 们 到 达 while 循环 并 得 知 根 为 5 的 子 树 不 含 合适 的 箱 
子 。 接 下 来 ， 移 到 节点 2 并 得 知 根 为 3 的 子 树 包含 合适 的 箱子 。 合 适 的 箱子 应 是 该 子 树 中 容 
量 大 于 或 等 于 7 的 最 左 箱 子 。 按 程序 13-2 的 策略 可 找到 这 个 箱子 一 一 箱子 5。 若 初始 假设 为 
lastBinUsed=3 且 objectSize[i]=9， 则 从 箱子 4 开始 查询 。 箱 子 4 和 箱子 5 都 无 足够 的 容量 ， 故 
取 p 等 于 5 并 到 达 while 循环 。 在 第 一 次 迭代 中 检查 bin[tree[6]].unusedCapacity， 并 得 知 根 为 
6 的 子 树 不 含 合适 的 箱子 。 然 后 ，p 移 到 节点 2， 并 得 知 根 为 3 的 子 树 包含 合适 的 箱子 。 用 程 
序 13-2 的 策略 可 找到 这 个 合适 的 箱子 一 一 箱子 7 是 空 的 ， 故 移 到 步骤 2， 确定 使 用 箱子 7。 
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步骤 1 要 求 我 们 按 树 的 菜 条 路 径 向 上 人 遍历， 然后 向 下 查找 最 左面 合适 的 箱子 ， 所 需 的 时 


耗 为 O(logn)。 利 用 程序 13-2 的 策略 ， 步 又 2 所 需 的 时 耗 为 O(logn)。 因 此 相 邻 适 配 策略 总 的 
时 间 复 杂 性 为 O(nlogn)。 


练习 


23. 


24. 


25; 


26. 


2 
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Oo 


29, 


30. 


假设 binCapacity=10，n=5，objectSize[0:4]=[6,1,4,4,5]。 

1 ) 确定 一 个 最 优 装载 。 

2 ) 分 别 使 用 FF、BF、FFD 和 BFD， 给 出 相应 的 物件 分 配方 案 。 

3 ) 对 装载 练习 2 )， 确 定 比率 (所 用 箱子 的 数量 / 所 需 箱子 的 最 少数 量 )。 

假设 binCapacity=11，z=30，objectSize[0:9]=2，objectSize[10:19]=3，objectSize[20:29] =6， 

重 做 练习 23 。 

函数 firstFitPack ( 见 程序 13-2 ) 将 一 个 物品 分 配给 一 个 箱子 的 时 耗 为 9(logn)， 即 使 当前 

所 使 用 的 箱子 数目 远 远 少 于 n。 如 果 从 包含 箱子 1 和 箱子 b (b 为 当前 已 经 使 用 的 最 右 箱 

子 ) 的 最 小 子 树 的 根 开始 搜索 ， 可 以 减少 这 个 时 间 ， 也 就 是 说 ， 从 箱子 1 和 箱子 b 的 最 近 

祖先 开始 搜索 。 例 如 ， 当 b 为 3 时 ， 从 节点 2 开始 搜索 。 如 果 在 箱子 1 到 箱子 b 中 没有 一 

个 箱子 的 容量 符合 条 件 ， 则 将 b 增 1。 另 外 ,在 组织 比赛 时 ， 只 需 重 赛 位 于 箱子 1 和 箱子 

b 的 最 近 公共 祖先 之 前 的 比赛 。 按 照 上 述 思 想 重 写 程序 13-2， 并 使 用 随机 生成 的 实例 ， 在 

n=1000、5000、50 000 和 100 000 的 情况 下 ， 比 较 前 后 两 个 程序 版 本 的 时 间 消 耗 。 

1 ) 给 类 completeWinnerTree 增加 公有 方法 : root()、leftChild(i) 和 rightChild(i)。 它 们 的 返 
回 值 分 别 是 赢 者 树 的 根 和 内 部 节点 i 的 左右 孩子 。 对 后 两 个 方法 ， 当 相应 的 孩子 是 外 
部 节点 时 ， 返 回 值 均 为 0。 

2 ) 重 写 firstFitPack ( 见 程序 13-2 )， 使 之 符合 13.5.1 节 所 述 的 信息 隐藏 原理 。 

虽然 证 明 最 先 适 配 法 和 最 优 适 配 法 的 箱子 数 不 会 超过 [(17/10)b(D1 很 困难 ( 其 中 xD 为 实 

例 工 所 需 的 最 少 箱子 数 )， 但 证 明 箱 子 数 不 会 超过 2b(7) 是 比较 容易 的 ， 请 证 明 。 


. 使 用 随机 生成 的 实例 ,在 n=500、1000、2000 和 5000 的 情况 下 ， 比 较 最 差 适 配 法 ( 见 第 


12 章 的 练习 36 )、 最 先 适 配 法 、 最 先 适 配 递减 法 和 相 邻 适 配 方法 各 自 所 用 的 箱子 数 。 

1 ) 利用 13.5.2 节 所 述 的 两 个 步 又， 基于 图 13-8 的 伪 码 ， 编 写 一 个 C++ 程序 ， 采 用 相 邻 适 
配 策略 实现 箱子 装载 。 

2 ) 利用 随机 产生 的 箱子 装载 实例 ， 比 较 相 邻 适 配 策略 和 最 先 适 配 策略 所 需要 的 箱子 数 。 

最 后 适 配 策略 是 把 每 一 件 物品 装 到 已 用 过 的 最 右 合适 的 箱子 ， 如 果 没有 这 样 的 箱子 ， 就 启 

用 一 个 新 箱子 。 编 写 一 个 C++ 程序 ， 实 现 这 个 策略 。 测 试 你 的 代码 。 计 算 时 间 复 杂 性 。 


13.6 ”参考 及 推荐 读物 


要 学 习 关 于 竞赛 树 的 更 多 的 知识 ， 可 参考 D. Knuth. The Art of Computer Programming: 


Sorting and Searching, Volume3. 2nd ed. Addison-Wesley, Reading, MA, 1998. 


关于 定理 13-1 的 证 明 ， 可 参看 M. Garey R.Graham, D. Johnson, et al. Resource Constrained 


Scheduling as Generalized Bin-Packing. Journal of Combinatorial Theory, Series A, 1976, 257-298. 
以 及 D. Johnson, A. Demers, J. Ullman, et al. Worst-Case Performance Bounds for Simple One-Dimensional 
Packing Algorithms. SIAM Journal on Computing, 1974, 299-325. 
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概述 


在 本 章 和 下 一 章 所 开发 的 树 形 结构 适合 于 字典 描述 。 虽 然 我 们 已 经 学 过 跳 表 和 散 列 ， 它 
们 都 可 以 用 于 字典 描述 ， 但 是 ,本章 的 二 又 搜索 树 和 下 一 章 的 平衡 搜索 树 使 用 更 灵活 ， 在 最 
坏 情 况 下 的 性 能 更 有 保证 。 

本 章 考察 二 又 搜索 树 和 索引 二 又 搜索 树 。 二 又 搜索 树 的 渐 近 性 能 可 以 和 跳 表 媲 美 : 查找 、 
插入 或 者 删除 操作 所 需要 的 平均 时 间 为 6(logn)， 而 最 坏 情况 下 的 时 间 为 9(n) ; 元素 按 升序 
输出 时 所 需 时 间 为 9(n)。 虽 然 在 最 坏 情况 下 的 查找 、 插 入 和 删除 操作 ， 散 列表 和 二 叉 搜 索 树 
的 时 间 性 能 相同 ,但 是 散 列表 在 最 好 的 情况 下 具有 超级 性 能 6(1)。 不 过 ， 对 于 一 个 指定 的 关 
键 字 ， 使 用 二 又 搜索 树 ， 你 可 以 在 @(n) 时 间 内 ， 找 到 最 接近 它 的 关键 字 。 例 如 ， 给 定 关键 字 
是 k， 你 可 以 在 8(n) 时 间 内 ， 找 到 最 接近 大 的 关键 字 ( 即 小 于 等 于 的 最 大 关键 字 ， 或 大 于 
等 于 上 的 最 小 关键 字 )。 而 对 散 列表 来 说 ， 这 种 操作 的 时 间 是 9(n+D)， 其 中 D 是 散 列表 除数 ; 
对 跳 表 来 说 ， 这 种 操作 的 时 间 是 O(logn)。 

使 用 索引 二 又 搜 索 树 ， 你 可 以 按 关 键 字 和 按 名 次 进行 字典 操作 ， 例 如 读 取 关 键 字 从 小 到 大 
排名 第 10 的 元 素 ， 删 除 关键 字 从 小 到 大 排名 第 100 的 元 素 。 按 名 次 的 操作 和 按 关键 字 的 操作 ， 
其 时 间 性 能 一 样 。 索 引 二 又 搜索 树 可 以 用 来 表示 线性 表 ( 见 第 5 章 ); 其 中 的 元 素 具 有 名 次 ( 即 
索引 )， 没 有 关键 字 。 在 这 种 线性 表 的 表示 中 ，get、erase 和 insert 操作 的 时 间 性 能 为 O(logn)。 
回忆 第 5 章 和 第 6 章 分 别 用 数组 和 链表 表示 的 线性 表 ， 它 们 实施 这 些 操 作 的 时 间 为 9(n)。 不 过 ， 
在 用 数组 表示 的 线性 表 中 ，get 操作 是 一 个 例外 ， 它 的 时 间 性 能 是 6(1)。 散 列表 无 法 通过 扩展 ， 
使 按 名 次 的 操作 更 快 。 而 跳 表 可 以 通过 扩展 ， 使 按 名 次 的 操作 可 以 在 (logn) 时 间 内 完成 。 

虽然 上 述 操作 对 二 又 搜索 树 和 跳 表 来 说 ， 在 最 坏 和 最 好 情况 下 的 渐 近 时 间 复 杂 性 是 相同 
的 ， 但 是 ,我们 可 以 对 二 又 搜索 树 加 以 平衡 限制 ， 使 上 述 的 每 一 个 操作 耗 时 都 是 9(logn)。 这 
是 第 15 章 的 主题 。 

本 章 有 三 个 二 又 搜索 树 的 应 用 。 第 一 个 是 直方 图 的 计算 。 第 二 个 是 13.5.1 节 的 NP- 复杂 
问题 一 一 箱子 装载 的 最 优 适 配 法 的 实现 。 最 后 一 个 是 关于 在 电子 布线 中 所 出 现 的 交叉 分 布 问 
题 。 在 直方 图 的 应 用 中 ， 使 用 散 列 函数 来 取代 搜索 树 ， 可 以 提高 性 能 。 在 最 优 适 配 箱子 装载 
应 用 中 ， 由 于 搜索 不 是 按 精确 匹配 完成 的 ， 所 以 不 能 使 用 散 列 函数 。 在 交叉 分 布 问题 中 ， 操 
作 是 按 名 次 完成 的 ， 因 此 也 不 能 使 用 散 列 函数 。 如 果 用 第 15 章 的 平衡 二 又 搜 索 树 替代 不 平衡 
二 又 搜索 树 ， 每 一 个 应 用 在 最 坏 情 况 下 的 时 间 性 能 都 会 得 到 改进 。 


14.1 定义 
14.1.1 二 叉 搜索 树 
在 10.1 节 我 们 引入 了 抽象 数据 类 型 dictionary， 在 10.5 节 我 们 用 散 列 来 描述 字典 ， 字 上 典 
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操作 ( 查找 、 插 入 和 删除 ) 所 需要 的 平均 时 间 为 @(1)。 而 这 些 操作 在 最 坏 情 况 下 的 时 间 与 字 
典 的 元 素 个 数 n 呈 线 性 关系 。 如 果 给 dictionary 增加 以 下 操作 ， 那 么 散 列 不 再 具有 较 好 的 平均 
性 能 : 

1 ) 按 关键 字 的 升序 输出 字典 元 素 。 

2 ) 按 升序 找到 第 个 元 素 。 

3 ) 删除 第 个 元 素 。 

为 了 执行 操作 1)， 需 要 从 表 中 收集 数据 ， 排 序 ， 然 后 输出 。 如 果 使 用 除数 为 DD 的 链 
表 ， 那么 能 用 O(D+n) 时 间 收 集 元 素 ， 用 O(nlogn) 时 间 排 序 ， 用 O(n) 时 间 输 出 ， 因 此 总 时 
间 为 O(D+nlogn)。 如 果 使 用 线性 开放 寻 址 ， 则 收集 元 素 所 需 时 间 为 0(5)， 其 中 4b 是 桶 的 个 
数 。 这 时 操作 1 ) 的 总 时 间 为 0(bB+nlogn)。 如 果 使 用 链表 ,操作 2) 和 3) 可 以 在 O(D+n) 的 
时 间 内 完成 ;如 果 使 用 线性 开放 寻 址 ， 那 么 它们 可 在 0(b) 时 间 内 完成 。 为 了 使 操作 2) 和 3 ) 
具有 这 样 的 时 间 性 能 ， 必 须 采 用 一 个 线性 时 间 算 法 来 确定 n 元 素 集 合 中 的 第 个 元 素 (参考 
18.2.4 节 )。 

如 果 使 用 平衡 搜索 树 ， 那 么 对 字典 的 基本 操作 ( 查找 、 插 入 和 删除 ) 能 够 在 O(logn) 的 
时 间 内 完成 ， 操 作 1 ) 能 在 6(n) 的 时 间 内 完成 。 使 用 索引 平衡 搜索 树 ， 我 们 也 能 够 在 O(logn) 
的 时 间 内 完成 操作 2) 和 3 )。14.6 节 将 考察 其 他 一 些 应 用 ， 对 它们 使 用 散 列 无 法 达到 而 使 用 
平衡 树 可 以 达到 较 好 的 性 能 。 

与 其 直接 学 习 平 衡 树 ， 不 如 首先 学 习 简 单一 些 的 二 又 搜 索 树 。 

定义 14-1 二 叉 搜索 树 ( binary search tree ) 是 一 棵 二 又 树 ， 可 能 为 空 ; 一 棵 非 空 的 二 又 
搜索 树 满足 以 下 特征 : 

1 ) 每 个 元 素 有 一 个 关键 字 ， 并 且 任 意 两 个 元 素 的 关键 字 都 不 同 ; 因此 ， 所 有 的 关键 字 都 
是 唯一 的 。 

2 ) 在 根 节 点 的 左 子 树 中 ， 元 素 的 关键 字 ( 如 果 有 的 话 ) 都 小 于 根 节点 的 关键 字 。 

3 ) 在 根 节点 的 右 子 树 中 ， 元 素 的 关键 字 ( 如果 有 的 话 ) 都 大 于 根 节点 的 关键 字 。 

4) 根 节 点 的 左 、 右 子 树 也 都 是 二 又 搜索 树 。 

此 定义 有 一 点 元 余 。 特 征 2)、3 ) 和 4 ) 在 一 起 已 经 说 明了 关键 字 是 唯一 的 。 因 此 ， 特 征 
1 ) 可 以 替换 为 : 根 节 点 有 关键 字 。 然 而 ， 前 一 种 定义 更 清楚 明了 。 

图 14-1 给 出 了 一 些 二 叉 树 ， 节 点 中 的 数字 是 元 素 的 关键 字 。 其 中 图 14-1a 尽管 满足 特征 
1)、2) 和 3 ), 但 仍然 不 是 二 义 搜 索 树 ， 因 为 它 的 右 子 树 不 满足 特征 4 )。 在 这 棵 子 树 中 ， 右 子 
树 的 关键 字 ( 22 ) 小 于 该 子 树 根 节点 的 关键 字 ( 25 )。 而 图 14-1b 和 图 14-1c 都 是 二 又 搜索 树 。 

二 又 搜索 树 的 所 有 元 素 都 有 一 个 唯一 的 关键 字 ， 这 个 要 求 可 以 去 除 ， 然 后 再 用 小 于 等 于 
代替 特征 2 ) 中 的 小 于 ， 用 大 于 等 于 代替 特征 3 ) 中 的 大 于 ， 这 样 的 二 又 树 称 为 有 重复 值 的 二 
叉 搜 索 树 (binary search tree with duplicates )。 
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图 14-1 二 叉 树 
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14.1.2 ”索引 二 叉 搜索 树 


索引 二 叉 搜索 树 ( indexed binary search tree ) 源 于 普通 二 又 搜索 树 ， 只 是 在 每 个 节点 中 
添加 一 个 leftSize 域 。 这 个 域 的 值 是 该 节点 左 子 树 的 元 素 个 数 。 图 14-2 是 两 棵 索引 二 又 搜索 
树 。 节 点 内 的 数字 是 元 素 的 关键 字 ， 节 点 外 的 数字 是 leftSize 的 值 。 注 意 ，leftSize 同时 给 出 
了 一 个 元 素 的 索引 ( 该 元 素 的 左 子 树 的 元 素 排 在 该 元 素 之 前 )。 例 如 ， 在 图 14-2a 的 根 为 20 
的 子 树 中 ， 元 素 按 顺序 分 别 为 12，15，18，20，25 和 30。 依 照 线性 表 的 形式 (eo, e1,…, e4)， 
根 的 索引 是 3， 它 等 于 根 元 素 的 leftSize 域 的 值 。 在 根 为 25 的 子 树 中 ， 元素 按 顺 序 排序 为 25 
和 30， 根 元 素 25 的 索引 是 0， 而 leftSize 的 值 也 是 0。 

2 (30) 


1(5) (%0)o 
wa) 


b) 





图 14-2 索引 二 又 搜索 树 


练习 


1. 具有 10 个 节点 的 完全 二 又 树 ， 关 键 字 为 [1,2,3,4,5,6,7,8,9,10]， 使 其 成 为 二 又 搜索 树 。 标 出 
每 个 节点 的 leftSize 域 的 值 。 

2. 具有 13 个 节点 的 完全 二 又 树 ， 关 键 字 为 [1,2,3,4,5,6,7,8,9,10,11,12,13]， 使 其 成 为 二 又 搜 索 
树 。 标 出 每 个 节点 的 leftSize 域 的 值 。 


14.2 ”抽象 数据 类 型 


ADT 14-1 是 二 叉 搜 索 树 的 抽象 数据 类 型 描述 。 索 引 二 又 搜 索 树 支持 二 又 搜索 树 的 所 有 操 
作 。 另 外 ， 它 还 支持 按 名 次 进行 的 查找 和 删除 操作 。ADT 14-2 是 索引 二 又 搜索 树 的 抽象 数据 
类 型 描述 。 抽 和 象 数 据 类 型 dBSTree ( 有 重复 值 的 二 又 搜索 树 ) 和 dIndexedBSTree 可 以 用 相同 
的 方法 描述 。 

程序 14-1 和 程序 14-2 是 C++ 抽象 类 ， 它 们 分 别 与 抽象 数据 类 型 bsTree 和 indexedBSTree 
对 应 。 


抽象 数据 类 型 hsTree 
{ 


实例 
二 叉 树 ， 每 一 个 节点 都 有 一 个 数 对 ， 其 中 一 个 成 员 是 关键 字 ， 另 一 个 成 员 是 数值 ; 所 有 关键 字 都 不 相同 ; 
任何 一 个 节点 的 左 子 树 的 关键 字 小 于 该 节点 的 关键 字 ; 右 子 树 的 关键 字 大 于 该 节点 的 关键 字 
操作 
find(h): 返回 关键 字 为 的 数 对 
insert(D): 插入 数 对 p 
erase( 有 ): 删除 关键 字 为 上 的 数 对 
ascend(): 按 关键 字 升序 输出 所 有 数 对 





ADT 14-1 二 又 搜 索 树 的 抽象 数据 类 型 描述 
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抽象 数据 类 型 IndexedBSTree 
{ 
实例 
与 bsTree 的 实例 相同 ， 只 是 每 一 个 节点 还 有 一 个 leftSize 域 
操作 


find( 避 : 返回 关键 字 为 大 的 数 对 


get(index): 返回 第 index 个 数 对 
insert(p): 插入 数 对 p - 
erase( 朋 : 删除 关键 字 为 大 的 数 对 
ascend(): 按 关 键 字 升序 输出 所 有 数 对 





ADT 14-2 ”索引 二 又 搜索 树 的 抽象 数据 类 型 说 明 
程序 14-1 C++ 抽象 类 bsTree 


template<class K, class E> 
class bsTree : public dictionary<K,E> 
{ 
public: 
virtual void ascend() = 0; 


1/ 按 关 键 字 升序 输出 


程序 14-2 C++ 抽象 类 indexedBSTree 


template<class K, class E> 
class indexedBSTree : public bsTree<K,E> 
{ 
public: 
virtual pair<const K, E>* get (int) const = 0; 
/ 根据 给 定 的 索引 ， 返 回 其 数 对 的 指针 
virtual void delete(int) = 0; 


1/ 根据 给 定 的 索引 ， 删 除 其 数 对 


练习 


3. 使 用 跳 表 实现 ADT14-1 的 bsTree 的 操作 ， 其 平均 时 间 为 多 少 ? 

4. 给 出 抽象 数据 类 型 dBSTree ( 有 重复 值 的 二 又 搜索 树 ) 的 描述 。 定 义 相 应 的 C++ 抽象 类 。 

5. 给 出 抽象 数据 类 型 dIndexedBSTree ( 有 重复 值 的 索引 二 义 搜索 树 ) 的 描述 。 定 义 相 应 的 
C++ 抽象 类 。 


14.3 ”二 叉 搜 索 树 的 操作 和 实现 
14.3.1 类 binarySearchTree 


因为 二 又 搜索 树 的 元 素数 量 和 形状 随 着 操作 而 改变 ， 所 以 二 又 搜索 树 要 用 11.4.2 节 的 链表 
来 描述 。 如 果 从 类 linkedBinaryTree ( 见 11.8 节 ) 派生 ， 类 binarySearchTree 的 设计 可 以 大 大 简 
化 。 元 素 类 型 是 一 个 偶 对 pair<const K,E>， 其 中 K 是 关键 字 类 型 , E 是 相应 的 元 素 的 数据 类 型 。 
因为 binarySearchTree 是 从 linkedBinaryTree 派生 而 来 的 ， 所 以 抽象 类 bsTree 的 方法 
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ascend 可 以 按 如 下 所 示 的 方式 调用 类 linkedBinaryTree 的 方法 inOrderOutput: 


void ascend() {inOorderOutput ();} 


方法 inOrderOutput 首先 输出 左 子 树 的 元 素 ( 关键 字 较 小 的 元 素 )， 然 后 输出 根 元 素 ， 最 
后 输出 右 子 树 的 元 素 ( 关键 字 较 大 的 元 素 )。 输 出 个 元 素 的 时 间 复 杂 性 是 O(n)。 


程序 14-3 binarySearchTree<K,E>::ascend 


void ascend () {inorderOutput ();} 


14.3.2 ”搜索 


假设 要 查找 关键 字 为 theKey 的 元 素 。 先 从 根 开始 查找 。 如 果 根 为 空 ， 那 么 搜索 树 不 包含 
任何 元 素 ， 即 查找 失败 。 如 果 不 空 ， 则 将 theKey 与 根 的 关键 字 相 比较 。 如 果 theKey 小 ， 那 
么 就 不 必 在 右 子 树 中 查找 ， 只 要 查找 左 子 树 。 如 果 theKey 大 ， 则 正好 相反 ， 只 需 查 找 右 子 
树 。 如 果 theKey 等 于 根 的 关键 字 ， 则 查找 成 功 。 在 子 树 的 查找 与 此 类 似 。 程 序 14-4 给 出 了 
相应 的 代码 。 该 过 程 的 时 间 复 杂 性 为 0(h)， 其 中 h 是 树 的 高 度 。 


程序 14-4 ”二 又 搜索 树 的 查找 


template<cjass K, class E> 
pair<const K, E>* binarySearchTree<K,E>::find(const K& theKey) const 
{1/ 返回 值 是 匹配 数 对 的 指针 
1/ 如 果 没 有 匹配 的 数 对 ， 返回 值 为 NULL 
/P 从 根 节点 开始 搜索 ， 寻 找 关键 字 等 于 theKey 的 一 个 元 素 
binaryTreeNode<pair<const K, E> > *p = root; 
while (p != NULL) 
// 检查 元 素 p->element 
if (theKey < p->element.first) 
卫 = p->leftchild; 
else 
if (theKey > p->element.first) 
P = p->rightChild; 
else 1/ 找到 匹配 的 元 素 


return &p->element; 


// 无 匹配 的 数 对 
return NULL; 


14.3.3 插入 


假设 要 在 二 又 搜索 树 中 插 人 一 个 新 元 素 thePair， 首 先 要 通过 查找 来 确定 ， 在 树 中 是 否 存 
在 某 个 元 素 ， 其 关键 字 与 thePair.first 相同 。 如 果 搜 索 成 功 ， 那 么 就 用 thePairsecond 替代 该 元 
素 的 值 。 如 果 搜 索 不 成 功 ， 那 么 就 将 新 元 
素 作 为 搜索 中 断 节 点 的 孩子 插 和 二 又 搜索 
树 。 例 如 ， 要 在 图 14-1b 中 插入 关键 字 为 
80 的 元 素 ， 首 先 搜 索 关 键 字 为 80 的 元 素 。 
搜索 不 成 功 ， 中 断 节 点 是 关键 字 为 40 的 





图 14-3 ”将 一 个 元 素 插入 二 又 搜索 树 
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元 素 ， 新 元 素 作为 该 节点 的 右 孩 子 插入 进去 。 插 入 后 的 结果 如 图 14-3a 所 示 。 在 图 14-3a 中 插 
人 关键 字 为 35 的 元 素 ， 结 果 如 图 14-3b 所 示 。 程 序 14-5 实现 了 上 述 插入 策略 。 


程序 14-5 ”将 一 个 元 素 揪 入 二 叉 搜索 树 


template<class K, class E> 
void binarySearchTree<K,E>::insert (const pair<const K, E>& thepair) 


{/ 插入 thePatr。 如 果 存 在 与 其 关键 字 相 同 的 数 对 ， 则 覆盖 


// 寻找 插入 位 置 
binaryTreeNode<pair<const K, E> > *p = root, 
*pp = NULL; 
while (p != NULL) 
{// 检查 元 素 p->element 
PP = pi 


/MP 移 到 它 的 一 个 孩子 节点 
if (thePair.first < p->element.first) 
P = p->leftchild; 
else 
if (thePair.first > p->element.first) 
p = p->rightCchild; 
已] Se 
{/ 覆盖 旧 的 值 
P->element .second = thepPair.second; 
return; 


} 


// 为 thePair 建立 一 个 节点 ， 然 后 与 pp 链接 
binaryTreeNode<pair<const K, E> > xnewNode 
= new binaryTreeNode<pair<const K, E> > (thepPair); 
if (root != NULL) 1/ 树 不 空 
if (thePair.first < pp->element.first) 
pp->leftChild = newNode; 
else 
pp->rightChild = newNode; 
else 
root = newNode; 1// 插 入 空 树 
treeSizet+t+} 


14.3.4 删除 


假设 要 删除 的 节点 是 p， 我们 需要 考虑 三 种 情况 : 1 ) p 是 树叶 ; 2 ) p 只 有 一 棵 非 空子 树 ; 
3 ) p 有 两 棵 非 空子 树 。 

首先 考察 情况 1 )， 要 删除 的 节点 是 叶 节点 。 处 理 的 方法 是 释放 该 叶 节点 空间 ， 若 是 根 节 
点 ， 则 令 根 为 NULL。 例 如 ， 要 删除 在 图 14-3b 中 关键 字 为 35 的 节点 ， 只 要 把 其 父 节点 的 左 
孩子 域 置 为 NULL， 然 后 释放 该 节点 即 可 ， 结 果 如 图 14-3a 所 示 。 要 删除 在 图 14-3b 中 关键 字 
为 80 的 节点 ， 只 要 把 关键 字 为 40 的 节点 的 右 孩 子 域 置 为 NULL， 并 释放 关键 字 为 80 的 节点 
即 可 ,结果 如 图 14-1b 所 示 。 

接 下 来 考察 情况 2 )， 要 删除 的 节点 p 只 有 一 棵 子 树 。 如 果 p 没 有 父 节点 ( 即 p 是 根 节 
点 )， 则 p 的 唯一 子 树 的 根 节点 成 为 新 的 搜索 树 的 根 节点 。 如 果 p 有 父 节点 pp， 则 修改 pp 的 
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指针 域 ， 使 得 它 指向 p 的 唯一 孩子 ， 然 后 释放 节点 p。 例 如 ， 如 果 要 删除 在 图 14-3b 中 关键 字 
为 5 的 节点 ， 则 修改 其 父 节 点 (关键 
字 为 30 的 节点 ) 的 左 孩 子 域 ， 使 其 指 
向 关键 字 为 2 的 节点 。 

最 后 考察 情况 3 )， 要 删除 的 节点 
p 具有 两 棵 非 空 子 树 。 我 们 先 将 该 节点 
的 元 素 替 换 为 它 的 左 子 树 的 最 大 元 素 
或 右 子 树 的 最 小 元 素 ， 然 后 把 替换 元 
素 的 节点 删除 。 假 设 要 删除 图 14-4a 的 
关键 字 为 40 的 元 素 ， 那 么 既 可 以 用 它 
左 子 树 中 的 最 大 元 素 (35 )， 也 可 以 用 
它 右 子 树 的 最 小 元 素 ( 60 ) 来 替换 它 。 
如 果 选 择 用 右 子 树 的 最 小 元 素来 蔡 换 ， 
那么 把 关键 字 为 60 的 元 素 移 到 40 的 
位 置 ， 关 键 字 为 40 的 元 素 便 被 删除 
了 ; 然后 把 原来 关键 字 60 所 在 的 叶 节 WY YO WY YO © 
点 删除 。 结 果 如 图 14-4b 所 示 。 

假设 在 删除 图 14-4a 的 关键 字 为 ss 
40 的 元 素 时 ， 用 其 左 子 树 的 最 大 元 素来 代替 。 左 子 树 的 最 大 元 素 为 35， 且 只 有 一 个 孩子 。 把 
关键 字 为 35 的 元 素 移 到 40 的 节点 ， 并 使 该 节点 的 左 孩 子 指针 指向 原来 35 所 在 节点 的 唯一 孩 
子 ， 结 果 如 图 14-4c 所 示 。 

再 来 看 另 一 个 例子 ， 删 除 图 14-4c 的 节点 30。30 这 个 节点 既 可 以 用 5， 也 可 以 用 31 来 替 
换 。 如 果 用 5 来 替换 ， 而 5 是 只 有 一 个 孩子 ， 那 么 只 要 令 5 的 父 节点 的 左 孩 子 指针 指向 原来 
节点 5 的 唯一 孩子 即 可 ， 结 果 如 图 14-4d 所 示 。 如 果 用 31 替换 30， 而 31 是 叶 节点 ， 那么 只 
需 删 除 该 叶 节 点 即 可 。 

注意 ， 右 子 树 的 最 小 关键 字 节 点 ( 左 子 树 的 最 大 关键 字 节 点 ) 要 么 没有 子 树 ， 要 么 只 有 
一 棵 子 树 。 要 在 一 个 节点 的 左 子 树 中 查找 关键 字 最 大 的 元 素 ， 先 移动 到 左 子 树 的 根 ， 然 后 沿 
着 右 孩 子 指针 移动 ， 直 到 右 孩 子 指针 为 NULL 的 节点 为 止 。 类 似 地 ， 要 在 一 个 节点 的 右 子 树 
中 查找 关键 字 最 小 的 元 素 ， 先 移动 到 右 子 树 的 根 ， 然 后 沿 着 左 孩 子 指针 移动 ， 直 到 左 孩 子 指 
针 为 NULL 的 节点 为 止 。 注 意 ， 要 删除 一 个 左右 子 树 都 不 为 空 的 元 素 节点 ， 我 们 的 算法 是 : 
先 替换 ， 然 后 删除 一 个 叶子 或 一 个 仅 有 单子 树 的 节点 。 

程序 14-6 实现 了 上 述 删除 算法 。 在 删除 一 个 具有 两 个 非 空 子 树 的 元 素 时 ， 该 程序 总 是 用 
其 左 子 树 的 最 大 元 素 进行 替换 。 当 元 素 的 数据 类 型 是 pair<const K,E> 时 ， 这 种 删除 操作 是 复 
杂 的 ， 而 且 改变 关键 字 也 是 不 可 能 的 。 该 算法 的 复杂 性 为 OUD。 


程序 14-6 ”二 叉 搜 索 树 的 删除 


template<class K, class E> 
void binarySearchTree<K,E>::erase (const Kg theKey) 


{// 删除 其 关键 字 等 于 theKey 的 数 对 





// 查找 关键 字 为 theKey 的 节点 
binaryTreeNode<pair<const K, E> > *p = root, 
*pp = NULL; 


上 党 14 莫 规 项 于 


while (p != NULL && p->element.first != theKey) 


{//P 移 到 它 的 一 个 孩子 节点 
PP = 了 7 
if (theKey < p->element.first) 
p = p->leftCcChild; 
else 
p = p->rightcChild; 
} 
if (p == NULL) 
return; // 不 存在 与 关键 字 theKey 匹配 的 数 对 


// 重新 组 织 树 结构 
1/ 当 P 有 两 个 孩子 时 的 处 理 


if (p->leftChild != NULL && p->rightChild 


{// 两 个 孩子 
// 转化 为 空 或 只 有 一 个 孩子 
1/ 在 P 的 左 子 树 中 寻找 最 大 元 素 


binaryTreeNode<pair<const K, E> > *s 


PS 
while (s->rightChild != NULL) 
{1/ 移 到 最 大 的 元 素 
BS = SF 


s = s->rightChild; 
} 


1/ 将 最 大 元 素 s 移 到 p， 但 不 是 简单 的 移动 


!= NULL) 


p->leftchild, 
p; /1 s 的 双亲 


//p->element = s->element ， 因 为 key 是 常量 


binaryTreeNode<pair<const K, E> > *q 
new binaryTreeNode<pair<const K, 


E> > 


(s->element, p->leftChild, p->rightCchild); 


if (pp == NULL) 
root = qd; 
else if (p == pp->leftChild) 
PP->1eftChild = q; 
else 
Pp->rightChild = q; 
if (Ps == p) PP = 9; 
else pp = ps; 
delete p; 
PS 
} 


/BP 最 多 有 一 个 孩子 
/把 孩子 指针 存放 在 c 
binaryTreeNode<pair<const K, E> > *c; 
if (p->leftChild != NULL) 

c= p->leftChild; 
else 

c = p->rightChilg; 


/删除 P 
if (P == root) 
root = C7 
else 
{WP 是 PP 的 左 孩 子 还 是 右 和 孩子 ? 
if (P == pp->leftChild) 
pp->leftChild = cec; 
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else pp->rightChild = ¢; 
} 
treeSize——; 
delete p; 


14.3.5 ”二 叉 搜索 树 的 高 度 


一 棵 个 元 素 的 二 又 搜索 树 ， 其 高 度 可 以 是 n。 例 如 ， 用 程序 14-5， 在 一 棵 初始 为 空 的 
二 叉 搜 索 树 中 ， 按 顺序 插入 一 组 关键 字 为 [1,2,3,…,n] 的 元 素 ， 树 的 高 度 便 是 n。 这 时 的 搜索 、 
插入 和 删除 操作 所 需要 的 时 间 均 为 O(n)。 这 个 性 能 比 无 序 链表 的 相应 操作 好 不 了 多 少 。 然 而 
我 们 可 以 证 明 ， 当 用 程序 14-5 和 程序 14-6 进行 随机 插入 和 删除 时 ， 二 又 搜 索 树 的 平均 高 度 是 
O(logn)。 这 时 ， 每 一 个 搜索 树 操作 的 平均 时 间 是 O(logn)。 


练习 


6. 假设 一 棵 二 又 搜索 树 为 空 。 

1 ) 使 用 本 节 的 插入 方法 ， 按 序 插入 一 组 关键 字 4,12,8,16,6,18,24,2,14,3。 画 出 每 次 搬 人 之 
后 的 结果 。 
2 ) 使 用 本 节 的 删除 方法 ， 对 1 ) 的 搜索 树 依次 删除 关键 字 6,14,16 和 4。 画 出 每 次 删除 的 结果 。 

7. 对 插入 的 关键 字 序 列 10,5,20,14,30,8,6,35,25,3,12,17 和 删除 的 关键 字 序列 35,30,20 和 10， 
重 做 练习 6。 

8. 扩展 类 binarySearchTree : 增加 一 个 公有 方法 outputInRange(theLow, theHigh)， 它 按 升序 输 
出 关键 字 在 theLow 和 theHigh 范围 内 的 元 素 。 使 用 递归 方法 ， 不 要 进入 空子 树 。 测 试 你 的 
代码 。 

9. 创建 程序 14-4 的 另 一 个 版 本 ， 其 中 while 循环 的 第 一 个 比较 表达 式 为 theKey==p->element. 
first。 与 程序 14-4 比较 在 搜索 所 有 元 素 时 所 需要 的 时 间 。 

10. 二 又 搜 索 树 可 用 来 对 n 个 元 素 排 序 。 编 写 一 个 排序 过 程 ， 首 先 将 n 个 元 素 a[0:n-1] 插入 一 
棵 空 的 二 又 搜索 树 ， 然 后 中 序 遍 历 搜 索 树 ， 并 将 元 素 按 序 放 人 数组 a 中 。 为 简单 起 见 ， 假 
设 数组 a 的 数据 是 互 不 相同 的 。 将 此 过 程 的 平均 运行 时 间 与 插入 排序 和 堆 排 序 进行 比较 。 

. 在 12.5 节 ， 我们 知道 了 如 何 用 线性 时 间 初 始 化 一 棵 元素 左 高 树 ， 如 何 用 对 数 时 间 合 并 
两 棵 左 高 树 。 本 练习 要 证 明 ， 关 于 初始 化 和 合并 操作 ， 二 又 搜索 树 的 时 间 复 杂 性 比 左 高 树 
的 要 大 。 为 此 ， 我 们 需要 排序 算法 的 时 间 复 杂 性 的 下 界 。 在 18.4.2 节 ， 我们 将 证 明 : 每 一 
个 nn 元素 排序 算法 的 时 间 复杂 性 至 少 是 O(nlogn)。 

1 ) 利用 这 个 结果 可 以 证 明 : 初始 化 和 创建 一 棵 元 素 的 二 叉 搜索 树 ， 其 耗 时 不 会 少 于 

O(nlogn)。 

2) 利用 排序 算法 的 时 间 复 杂 性 的 下 界 证 明 : 合并 两 个 二 又 搜索 树 的 时 间 不 会 少 于 
O(n+m)， 其 中 和 m 分 别 是 要 合并 的 二 叉 搜 索 树 的 元 素 个 数 。 

12. 扩展 类 binarySearchTree : 增加 一 个 函数 split ( theKey, lessThan, greaterThan )。 该 函数 把 

二 叉 搜索 树 *this 分 解 为 两 棵 二 又 搜索 树 : 一 棵 是 lessThan， 它 包含 *this 中 所 有 关键 字 小 

于 theKey 的 元 素 ; 另 一 棵 是 greaterThan， 它 包含 *this 中 所 有 关键 字 大 于 theKey 的 元 素 。 

如 果 二 又 搜索 树 *this 含 一 个 关键 字 为 theKey 的 元 素 ， 那 么 函数 split 的 返回 值 便 是 指向 这 
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个 元 素 的 指针 ， 和 否则， 返回 值 为 NULL。 在 函数 split 执行 之 后 ，*this 是 一 棵 空 树 。 该 函 
数 的 时 间 复 杂 性 是 O(h)， 其 中 及 是 分 解 前 的 树 高 。 测 试 你 的 代码 。 

13. 产生 一 个 从 1 到 的 随机 排列 ， 并 作为 一 组 关键 字 ， 按 随机 排列 顺序 插入 一 棵 空 的 二 又 树 
搜索 树 。 测 量 二 又 树 的 高 度 。 对 若干 个 随机 排列 ， 重 复 以 上 实验 。 计 算 二 又 树 高 度 的 平均 
值 ， 并 与 2[log;(n+1)| 比 较 。n 的 值 分 别 为 100、500、1000、10 000、20 000、50 000。 

14. 扩展 类 binarySearchTree : 增加 一 个 迭代 器 ， 可 以 按 关 键 字 的 升序 顺序 查看 元 素 。 遍 历 n 
个 元 素 搜索 树 的 时 间 应 该 是 O(n)， 所 有 方法 的 时 间 复 杂 性 不 会 超过 0(h)， 空 间 需 求 应 为 
O(h)， 其 中 有 是 树 高 。 测 试 你 的 代码 。 

15. 编写 一 个 函数 ， 从 二 又 搜 索 树 中 删除 关键 字 最 大 的 元 素 。 函 数 的 时 间 复 杂 性 必须 而 且 可 以 
证 明 是 0(h)， 其 中 及 是 树 高 。 

1 ) 用 合理 的 测试 数据 测试 代码 的 正确 性 。 

2 ) 随机 产生 一 个 n 元 素 的 线性 表 和 一 个 长 度 为 m 的 插入 和 最 大 删除 操作 序列 。 在 操作 序 
列 中 ,插入 操作 的 概率 应 近似 为 0.5( 同样 ， 最 大 删除 操作 的 概率 也 近似 为 0.5 )。 使 用 
第 一 个 随机 线性 表 的 n 个 元 素 初始 化 一 个 大 根 堆 和 一 棵 二 叉 搜 索 树 。 分 别 测量 用 大 根 
堆 和 二 叉 搜 索 树 执行 m 个 操作 的 时 间 。 用 该 时 间 除 以 m 得 到 每 一 操作 的 平均 时 间 。 分 
别 对 n=100，500，1000，2000, &…，5000 和 m=5000， 重 复 进行 这 个 实验 。 将 实验 
结果 用 表格 形式 给 出 。 

3 ) 通过 实验 ， 对 比 这 两 种 优先 级 队列 的 优点 。 


14.4” 带 有 相同 关键 字 元 素 的 二 叉 搜索 树 


当 一 棵 二 叉 搜索 树 可 以 具有 两 个 或 多 个 关键 字 相 同 的 元 素 时 ， 相 应 的 类 称 为 
dBinarySearchTree。 要 实现 这 个 类 ， 只 需 修改 程序 14-5 的 函数 binarySearchTree<K，E>::insert,， 
即将 while 循环 中 的 语句 


if (thePair.first<p->element .first) 


改 为 


if(thepair.first<=p->element.first) 


如 程序 14-7 所 示 。 
程序 14-7 ”修改 程序 14-5 的 while 循环 以 允许 相同 关键 字 


while (p != NULL) 
{// 检查 元 素 p->element 
PP = Pp’; 


WP 移 到 它 的 一 个 孩子 节点 
if (thePair.first < p->element.first) 
P = p->leftchild; 
else 
Bs DB->ridhitehildy 
} 


如 果 把 个 元 素 插 入 一 个 初始 为 空 的 二 叉 搜 索 树 中 ， 而 且 n 个 元 素 的 关键 字 都 相同 ， 那 
么 结果 是 一 棵 高 度 为 n 的 左 偏 树 。 解 决 这 个 问题 的 一 个 方法 请 看 练习 17。 
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练习 


16. 利用 本 节 的 插入 方法 ， 把 关键 字 2,2,2 和 2 插入 初始 为 空 的 带 有 相同 关键 字 的 二 又 搜索 树 。 
画 出 每 次 插入 的 结果 。 如 果 插 入 nn 个 2， 那 么 树 高 是 多 少 ? 

17. 为 C++ 类 dBinarySearchTree 的 插入 函数 设计 一 个 新 的 实现 方法 : 遇 到 关键 字 等 于 thePair. 
first 的 节点 ,不 是 像 程序 14-7 那样 移 向 它 的 左 子 树 ， 而 是 通过 随机 数 生 成 器 ， 以 相同 的 
概率 移 向 左 子 树 或 右 子 树 。 测 试 你 的 代码 。 


14.5 索引 二 叉 搜 索 树 


类 indexedBinarySearchTree 可 以 定义 为 类 linkedBinaryTree ( 见 练习 19 ) 的 派生 类 。 对 于 
类 indexedBinarySearchTree， 一 个 节点 的 数值 域 是 三 元 的 : leftSize、key、value。 

我 们 实施 带 有 索引 的 搜索 方法 与 搜索 偶 对 ( 一 个 偶 对 被 定义 为 关键 字 域 key 和 值 域 
value ) 的 方法 是 类 似 的 。 考 虑 图 14-2a 的 树 。 假 设 我 们 要 查找 索引 为 2 的 元 素 。 根 的 leftSize 
域 的 值 是 3， 因 此 ， 我 们 要 查找 的 元 素 在 根 的 左 子 树 。 再 进一步 说 ， 我 们 要 查找 的 元 素 在 左 
子 树 的 索引 为 2。 因 为 左 子 树 的 根 ( 即 15 ) 的 leftSize 值 是 1， 所 以 我 们 要 查找 的 元 素 在 15 
的 右 子 树 。 然 而 ,在 15 的 右 子 树 中 ， 待 查 元 素 的 索引 不 再 是 2， 因 为 15 的 右 子 树 元 素 都 排 
在 15 的 左 子 树 元 素 和 15 之 后 。 为 了 确定 待 查 元 素 在 15 的 右 子 树 中 的 索引 ， 我 们 要 用 2 减 去 
leftSize+1， 其 中 1leftSize 是 15 的 leftSize 值 (1 )。 结 果 是 2-(1+1)=0。15 的 右 子 树 的 根 是 18， 
它 的 leftSize 值 是 0， 因 此 待 查 元 素 便 是 18。 

把 一 个 元 素 插 入 索引 二 又 搜索 树 中 ， 使 用 的 过 程 类 似 程序 14-5。 不 过 要 在 根 至 新 插入 节 
点 的 路 径 上 修改 leftSize 域 的 值 。 

通过 索引 实施 删除 的 过 程 是 : 首先 按 索引 进行 搜索 ， 确 定 要 删除 的 元 素 的 位 置 ; 然后 
按照 14.3.4 节 的 概述 进行 删除 ; 接 下 来 ， 如 果 需 要 ,在 从 根 节点 到 删除 节点 的 路 径 上 更 新 
leftSize 域 。 

查找 、 插 入 和 删除 所 需要 的 时 间 是 0(h)， 其 中 有 hh 是 索引 搜索 树 的 高 。 


练习 


18. 假设 有 一 棵 空 的 索引 二 又 搜索 树 。 

1 ) 使 用 本 节 的 插入 方法 ， 依 次 插入 关键 字 4,12,8,16,6,18,24,2,14,3。 画 出 每 次 插入 后 的 图 。 
显示 leftSize 的 值 。 

2 ) 使 用 本 节 的 方法 ， 查 找 关 键 字 3,6 和 8。 描述 每 一 次 查找 过 程 。 

3 ) 从 1 ) 的 树 开 始 ， 使 用 本 节 的 方法 ,依次 删除 索引 为 7,5 和 0 的 关键 字 。 画 出 每 一 次 删 
除 后 的 搜索 树 。 

19. 设计 C++ 类 indexedBinarySearchTree， 并 从 抽象 类 indexedBSTree 派生 。 测 试 你 的 代码 。 
用 元 素数 量 和 树 高 来 表示 每 一 个 成 员 函 数 的 时 间 性 能 。 

20. 对 带 有 重复 关键 字 的 索引 二 叉 搜索 树 类 dIndexedBinarySearchTree， 重 做 练习 19。 

21. 把 一 个 线性 表 描 述 为 一 棵 索引 二 又 树 ， 它 像 一 棵 索引 二 又 搜索 树 ， 只 是 节点 没有 关键 字 。 每 
一 个 节点 只 包含 线性 表 的 一 个 元 素 。 当 中 序 遍历 索引 二 又 树 时 ， 从 左 到 右 访 问 线性 表 的 元 素 。 
1) 一 棵 完全 二 叉 树 有 11 个 节点 。 每 一 个 节点 用 它 的 leftSize 值 编号 。 把 线性 表 

A=[a,b,c,d,e,f,g,h,ij,k] 的 元 素 插 人 索引 二 叉 树 。 注 意 ， 当 中 序 遍 历 这 棵 二 又 树 时 ， 访 问 
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元 素 的 顺序 是 在 线性 表 中 的 元 素 顺序 。 

2) 对 1) 中 的 树 ， 使 用 类 似 二 又 搜索 树 的 插入 方法 ， 依 次 实施 下 列 线性 表 的 插 和 人 操作 : 
insert(4,m)，insert(9,n)，insert(0,p)，insert(14,q)。 使 用 leftSize 域 的 值 寻找 新 市 点 的 插 
人 位 置 。 

3 ) 对 2) 中 的 树 ， 使 用 类 似 索 引 二 又 搜索 树 的 删除 方法 ， 依 次 实施 下 列 线性 表 的 删除 操 
作 : erase(0)，erase(3)，erase(8)，erase(7)。 

设计 一 个 类 linearListAsBinaryTree， 它 把 线性 表 描 述 为 一 个 索引 二 又 树 ( 见 练习 21 )。 它 

的 实现 可 以 支持 程序 5-1 所 定义 的 所 有 线性 表 的 操作 。 
实现 插入 操作 insert(index,theElement) 的 一 个 简单 方法 是 : 首先 找到 索引 为 index-1 

的 节点 p， 然 后 使 新 元 素 为 p 的 右 孩 子 ， 最 后 使 节点 p 原来 的 右 子 树 成 为 新 插入 元 素 的 右 

子 树 。 然 而 ， 由 于 这 种 插入 方法 从 来 不 会 使 一 个 新 元 素 成 为 男 一 个 元 素 的 左 孩 子 ， 所 以 所 

得 到 的 树 是 右 偏 斜 的 〈 即 所 有 左 孩 子 域 为 0 )， 高 度 等 于 元 素 个 数 。 

要 建立 一 棵 二 叉 树 ， 高 度 为 元 素 个 数 的 对 数 ， 我 们 要 既 能 创建 左 子 树 ， 又 能 创建 右 子 
树 。 当 找到 索引 为 index-1 的 节点 p 时 ， 我 们 可 以 做 的 是 : 1 ) 是 新 元 素 成 为 节点 p 的 右 孩 
子 ， 然 后 是 p 的 原 右 子 树 成 为 新 元 素 的 右 子 树 ; 或 2 ) 使 新 元 素 成 为 节点 p 的 父 节 点 的 左 
孩子 或 右 孩 子 (取决 于 p 是 其 父 节 点 的 左 孩 子 还 是 右 孩 子 )， 使 p 成 为 新 元 素 的 左 孩 子 ， 使 
p 的 原 右 子 树 成 为 新 元 素 的 右 子 树 ; 或 3 ) 使 新 元 素 成 为 p 的 右 子 树 的 最 左边 的 节点 。 到 底 
做 哪 一 项 操作 应 该 是 随机 的 ， 这 样 就 可 以 得 到 比较 平衡 的 树 。 你 的 插入 代码 应 该 随机 选择 。 

除了 方法 indexOf， 所 有 方法 的 运行 时 间 应 该 是 对 数 级 的 或 更 少 。 证 明确 实 如 此 。 你 
可 以 假设 二 叉 树 的 平均 高 度 是 元 素 个 数 的 对 数 。 





14.6 ”应 用 
14.6.1 直方 图 


1. 何 为 直方 图 
在 直方 图 问题 中 ,输入 由 个 关键 字 所 构成 的 集合 ， 然 后 输出 一 个 列表 ， 它 包含 不 同 关 


键 字 及 其 每 个 关键 字 在 集合 中 出 现 的 次 数 ( 频率 )。 图 14-5 是 一 个 含有 10 个 关键 字 的 例子 。 
图 14-5a 是 直方 图 的 输入 ， 图 14-5b 是 直方 图 的 输出 表格 ， 图 14-5c 是 直方 图 的 条 形 图 。 直 方 
图 一 般 用 来 确定 数据 的 分 布 。 例 如 ， 一 次 考试 的 分 数 、 一 个 图 像 的 灰 度 值 、 盖 恩 斯 维尔 注册 
的 汽车 和 洛杉矶 居民 的 最 高 学 位 ， 都 可 以 用 直方 图 表示 。 


n=10; 关键 字 =[2, 4, 2, 2, 3, 4, 2, 6, 4, 2] 
a) 输入 








5 
和 人 
3 

频率 

2 

1 

















b) 输出 直方 图 表格 c) 直方 图 条 形 图 
图 14-5 直方 图 举例 
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2. 简单 直方 图 程序 

当 关 键 字 的 值 是 0 到 + 范围 内 的 整数 ， 且 + 的 值 足 够 小 时 ， 直 方 图 可 以 在 线性 时 间 里 ， 
用 一 个 很 简单 的 过 程 〈 见 程序 14-8 ) 来 计算 ， 它 用 数组 元 素 h[i] 代表 关键 字 i 的 频率 。 其 他 
整 型 关键 字 可 以 首先 映射 到 这 个 范围 ， 以 便 应 用 程序 14-8 来 计算 直方 图 。 例 如 ， 如 果 关 键 字 
是 小 写字 母 ， 则 可 以 用 映射 [a,b,…,z]=[0,1,…,25]。 


程序 14-8 ”简单 的 直方 图 程序 


void main (void) 


{1/ 非 负 整 型 值 的 直方 图 
int ny， // 元 素 个 数 
r; 110 至 工 之 间 的 值 
cout << "Enter number of elements and range" 
<< endl; 


Cin SS 二 -> 


1/ 生成 直方 图 数组 h 


int *h = new int[r+1]; 
/将 数组 h 初始 化 为 0 
for (int i 二 07 i = TH 1++) 


h[i] = 0; 


1/ 输 入 数据 ， 然 后 计算 直方 图 


for (i = 1; i <= n; i++) 
{1/ 假设 输入 的 值 在 0 至 工 之 间 
int key; // 输入 值 
cout << "Enter element " << i << endl; 
Cin >> key; 
h[key]++; 
} 
// 输出 直方 图 
cout << "Distinct elements and frequencies are" 
<< endl; 
fer (让 三 ,0 二 <= ¥ + 
if (pri != 0) 
COUt < 1 a ™ " << h[i] << endl; 


} 


3. 直方 图 与 二 又 搜索 树 

当 关 键 字 类 型 不 是 整 型 ( 如 关键 字 是 实数 ) 而 且 关 键 字 范围 很 大 时 ， 程 序 14-8 就 不 适用 
了 。 假定 要 确定 一 个 文本 中 不 同 单词 出 现 的 频率 ， 可 能 出 现 的 不 同 单词 的 数量 比 实际 的 数量 
要 大 得 多 。 在 这 种 情况 下 ， 可 以 用 散 列 求解 ， 平 均 时 间 性 能 为 O(n) ( 见 练习 24 )。 或 者 ， 可 
以 将 关键 字 排 序 ， 然 后 用 一 个 简单 的 自 左 至 右 的 扫描 方法 确定 每 一 个 不 同 关 键 字 的 数量 。 排 
序 可 在 O(nlogn) 时 间 内 完成 ( 例如， 用 程序 12-8 的 heapSort 堆 排序 )， 随 后 的 从 左 至 右 扫 描 
需要 8@(n)， 因 此 总 的 时 间 复 杂 性 是 O(nlogn)。 

当 与 n 相 比 ， 不 同 关键 字 的 数量 m 非常 小 时 ， 用 排序 求解 直方 图 的 方法 可 以 进一步 改进 。 
使 用 平衡 搜索 树 ， 例 如 AVL 和 红 - 黑 树 ( 见 第 15 章 )， 可 以 在 O(nlogm) 时 间 内 解决 直方 图 
问题 。 另 外 ， 用 平衡 搜索 树 求解 ， 只 需 在 内 存 中 对 不 同 关键 字 排 序 即 可 。 即 使 的 值 非常 大 ， 
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内 存 不 能 容纳 所 有 的 关键 字 ， 但 只 要 内 存 足够 容纳 不 同 的 关键 字 ， 这 种 方法 都 是 适用 的 。 

本 节 方 法 使 用 的 是 二 又 搜索 树 ， 而 不 是 平衡 搜索 树 ， 因 此 ， 平均 复杂 性 为 O(nlogm)。 

4. 类 binarySearchTreeWithVisit 

为 了 求解 实施 直方 图 问题 的 二 又 搜索 树 方法 ,我 们 首先 定义 类 binarySearchTreeWithVisit， 
它 是 类 binarySearchTree 的 扩展 ， 其 中 增加 了 以 下 公有 成 员 函 数 : 


void insert (const pair<const K,E>& thePair, void(*visit) (E&)) 


该 函数 将 元 素 thePair 插入 搜索 树 ， 前 提 是 ， 在 树 中 不 存在 关键 字 等 于 thePair.first 的 元 
素 。 若 存在 一 个 关键 字 等 于 thePair.first 的 元 素 p， 则 调用 函数 visit(p.second)。 

5. 重新 考虑 直方 图 与 二 又 搜索 树 

程序 14-9 是 用 二 又 搜索 树 求解 直方 图 问题 的 代码 。 它 把 输入 数据 插入 类 型 为 
binarySearchTreeWithVisit 的 对 象 ， 然 后 调用 函数 ascend 输出 直方 图 。 二 又 搜索 树 的 每 一 个 
元 素 都 有 两 个 成 员 ， 第 一 个 成 员 是 关键 字 ， 第 二 个 成 员 是 关键 字 的 频率 。 在 访问 一 个 元 素 时 ， 
该 元 素 的 频率 增 1。 


程序 14-9 ”使 用 搜索 树 的 直方 图 
int main(void) 
{W 使 用 搜索 树 的 直方 图 
int ry // 元 素 个 数 
cout << "Enter number of elements" << endl; 
Gin SS Bs 


1/ 输入 元 素 ， 然 后 插入 树 
binarySearchTreeWithVisit<int, int> theTree; 
for (int i = 1; i <= n; i++) 


{ 


pair<int, int> thepair; 1// 输 入 元 素 
cout << "Enter element " << i << endl; 

cin >> thepair.first; /关键 字 
thePair.second = 1; // 频率 


/将 thePair 插入 树 ， 除 非 存 在 与 之 匹配 的 元 素 
/在 后 一 种 情况 下 ，count 值 增 1 
theTree.insert (thePair, addl); 

} 


/ 输出 不 同 的 关键 字 和 它们 的 频率 

Cout << "Distinct elements and frequencies aren" 
<< endl; 

theTree.ascend(); 


14.6.2 ”箱子 装载 问题 的 最 优 匹 配 法 


1. 使 用 带 有 重复 关键 字 的 二 又 搜索 树 

将 nn 个 物品 装 到 容量 为 c 的 箱子 中 ， 其 最 优 匹配 方法 已 在 13.5.1 节 中 介绍 过 。 使 用 带 有 
重复 关键 字 的 二 叉 搜 索 树 ， 我 们 能 够 在 O(nlogn) 时 间 内 实现 最 优 匹配 法 。 使 用 平衡 搜索 树 ， 
在 最 坏 情 况 下 的 时 间 复 杂 性 是 @(nlogn)。 

在 实现 最 优 匹配 法 时 ， 搜 索 树 的 每 个 元 素 代 表 一 个 正在 使 用 且 剩 余 容 量 不 为 0 的 箱子 。 





假设 要 装载 物品 i, 已 使 用 的 箱子 有 9 个 (a~i)， 它 们 都 有 剩余 容量 。 这 些 剩余 容量 分 别 是 
1,3,12,6,8,1,20,6 和 5。 注意 ， 箱 子 不 同 ,但 剩余 容量 可 能 相同 。 可 以 用 一 棵 带 有 重复 关键 字 
的 二 又 搜索 树 ( 即 dBinarySearchTree 的 实例 ) 来 描述 这 9 个 箱子 ， 每 个 箱子 的 剩余 容量 作为 
节点 的 关键 字 。 

图 14-6 是 这 样 一 棵 二 又 搜索 树 ， 它 有 9 个 箱子 。 节 点 内 部 值 是 箱子 的 剩余 容量 ， 节 点 外 
部 字母 是 箱子 的 名 称 。 如 果 要 装载 的 物品 i 需要 objectSize[i]=4 个 单位 的 空间 ， 那 么 从 根 节点 
开始 搜索 ， 可 以 找到 最 优 匹配 的 箱子 。 由 根 节点 可 知 ， 箱 子 h 的 剩余 容量 是 6。 因 为 箱子 
可 以 装载 物品 i， 所 以 它 成 为 一 个 候选 者 。 而 且 因 
为 在 右 子 树 中 ， 所 有 箱子 的 剩余 容量 至 少 是 6， 所 
以 只 需要 在 左 子 树 中 寻找 最 匹配 的 箱子 。 因 为 箱子 
的 剩余 容量 不 足以 容纳 物品 i， 所 以 要 到 5b 的 右 子 a d(6) (20)s 
树 寻 找 。 右 子 树 的 根 节点 是 箱子 i， 它 的 剩余 容量 1) 
可 以 容纳 物品 i， 因 此 箱子 i 成 为 新 的 候选 者 。 然 后 ey 
进 和 箱子 i 的 左 子 树 寻 找 。 因 为 箱子 i 的 左 子 树 为 图 146 营 有 重复 关键 子 的 一 叉 搜 索 树 
空 ， 不 可 能 再 有 更 好 的 候选 者 ， 所 以 箱子 i 即 是 我 们 要 找 的 箱子 。 

再 看 另 一 个 例子 ， 假 设 objectSize[i]=7。 从 根 节点 开始 搜寻 。 根 节点 的 箱子 h 不 能 装载 物 
品 i?， 因 此 转移 到 右 子 树 中 寻找 。 箱 子 c 可 以 容纳 物品 i， 因此 成 为 候选 箱子 。 然 后 到 cc 的 左 
子 树 中 寻找 ， 箱 子 4 不 能 装载 物品 i， 因 此 进入 4 的 右 子 树 寻找 。 箱 子 e 可 以 容纳 物品 i， 因 
此 成 为 新 的 候选 者 。 然 后 进入 e 的 左 子 树 寻找 。 因 为 左 子 树 为 空 ， 所 以 寻找 停止 。 

当 我 们 为 物品 i 找到 最 匹配 的 箱子 后 ， 可 以 将 它 从 搜索 树 中 删除 ， 将 其 剩余 容量 减 去 
objectSize[i] ， 再 将 它 重新 插入 树 中 ( 除非 它 的 剩余 容量 为 零 )。 若 没有 找到 最 匹配 的 箱子 ， 则 
启用 一 个 新 箱子 。 

2. C++ 实现 

为 了 实现 上 述 算法 ， 我 们 既 可 以 采用 类 dBinarySearchTree， 可 以 得 到 平均 性 能 O(logn)， 
也 可 以 采用 类 davlTree ( 见 15.1 节 )， 它 在 各 种 情况 中 都 能 得 到 平均 性 能 O(logn)。 无 论 哪 
一 种 方法 ， 都 需要 扩充 类 的 定义 ， 增 加 公有 成 员 函 数 findGE(theKey)， 它 的 返回 值 是 剩余 
容量 既 大 于 等 于 thKey 又 是 最 小 的 箱子 。findGE 的 代码 如 程序 14-10 所 示 。 它 的 复杂 性 是 
O(height)。 如 果 类 davlTree 是 扩展 的 ， 而 不 是 dBinarySearchTree， 那 么 代码 不 用 修改 。 











程序 14-10 ”查找 大 于 等 于 theKey 的 最 小 关键 字 


template<class K, class E> 
pair<const K, E>* dBinarySearchTreeWithGE<K,E>::findGE (const K& theKey) const 
{1/ 返回 一 个 元 素 的 指针 ， 这 个 元 素 的 关键 字 是 不 小 于 theKey 的 最 小 关键 字 
1/ 如 果 这 样 的 元 素 不 存在 ， 返 回 NULL 
binaryTreeNode<pair<const K, E> > *currentNode = root; 
pair<const K, E> *bestElement = NULL; /W/ 目前 找到 的 元 素 ， 其 关键 字 是 不 小 于 
/MtheKey 的 最 小 关键 字 
1/ 对 树 搜索 
while (currentNode != NULL) 
//currentNode->element 是 一 个 候选 者 吗 
if (currentNode->element.first >= theKey) 
{// 是 ，currentNode->element 是 比 bestElement 更 好 的 候选 者 
bestElement = &currentNode->element; 


/ 左 子 树 中 唯一 较 小 的 关键 字 
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currentNode = currentNode->leftChild; 
} 


else 
1// 不 是 ，currentNode->element.first 太 小 


1/ 检查 右 子 树 


currentNode = currentNode->rightChild; 


return bestElement; 


程序 14-11 的 函数 bestFitPack 实现 最 优 匹配 方法 ， 其 中 的 元 素 有 两 个 成 员 ， 第 2 个 成 员 
是 箱子 标识 符 〈 箱子 号 )， 第 1 个 成 员 是 箱子 剩余 容量 。 


程序 14-11 箱子 装载 问题 的 最 优 匹配 法 


void bestFitPack (int *objectSize, int numberOfObjects, int binCapacity) 
{1/ 输出 容量 为 binCapacity 的 最 优 箱子 匹配 . 
/objectSsize[1:numberOfobjects] 是 物品 大 小 
int n = numberOfObjects; 
int binsUsed = 0; 
dBinarySearchTreeWithGE<int,int> theTree; 1/ 箱子 容量 树 
pair<int, int> theBin; 


1/ 将 物品 逐个 装 箱 
Eo (int YT = 3% 二 <= ny T++) 
{/ 将 物品 i 装 箱 

/寻找 最 匹配 的 箱子 

pair<const int, int> *bestBin = theTree.findGE (objectSizel[i]); 

if (bestBin == NULL) 

{1/ 没有 足够 大 的 箱子 ， 启 用 一 个 新 箱子 
theBin.first = binCapacity; 
theBin.second = ++binsUsed; 

} 

else 

{/ 从 树 theTree 中 删除 最 匹配 的 箱子 
theBin = *bestBin; 
theTree.erase (bestBin->first); 

} 


cout, << pack object ™ < 1 < 下 ing bln ™ 
<< theBin.second << endl; 


1/ 将 箱子 插 到 树 中 ， 除 非 箱子 已 满 

theBin.first -= objectSizel[il]; 

if (theBin.first > 0) 
theTree.insert (theBin),; 


14.6.3 ”交叉 分 布 


1. 通道 布线 与 交叉 
在 交叉 分 布 问题 中 ， 从 一 个 布线 通道 开始 ， 在 通道 的 顶部 和 底部 各 有 n 个 针脚 。 图 14-7 
是 一 个 n=10 的 实例 。 布 线 区 域 是 带 阴影 的 长 方形 区 域 。 在 通道 的 顶部 和 底部 ， 针 脚 从 左 至 


354 锚 二 部 分 发 据 结 祈 





右 ， 从 1 到 编号。 另外 ， 对 [1,2,3,…,n] 的 一 个 排列 C， 用 一 条 线路 将 项 部 的 针脚 i 与 底部 
的 针脚 C; 连接 起 来 。 在 图 14-7 的 实例 中 : C=[8,7,4,2,5,1,9,3,10,6]。 实 现 这 些 连接 的 n 条 线路 
从 1 到 nn 编号。 线路 i 连接 顶部 的 针脚 i 和 底部 的 针脚 Ci。 当 且 仅 当 ;i 时 ， 线 路 i 在 线路 j 
的 左边 。 











C=[8, 7, 4, 2, 5, 1, 9, 3, 10, 6] 
图 14-7 布线 实例 


在 图 14-7 的 布线 区 域 中 ， 无 论 线路 9 和 10 如 何 布设 ， 它 们 一 定 会 在 某 一 点 交叉 。 理 想 
的 情况 是 没有 交叉 ， 和 否则 要 对 交叉 做 特别 处 理 ， 以 免 出 现 短路 。 例 如 ， 在 交叉 点 放置 绝缘 物 ， 
或 加 层 。 所 以 ， 要 使 交叉 数目 最 少 。 可 以 证 明 ， 按 图 14-7 的 直线 布设 ， 交 叉 数 目 是 最 少 的 。 

每 个 交叉 用 一 个 数 对 (ii) 表示， 其 中 i 和 j 是 两 条 交叉 的 
线路 。 为 了 避免 一 个 交叉 提 及 两 次 ， 我 们 要 求 icj ( 注意， 交叉 
(10,9) 和 (9,10 ) 是 一 样 的 ) 注意 ， 线 路 莽 和 7 交叉 (i<ij)， 当 
且 仅 当 Ci>Cj。 令 ki 表示 这 种 数 对 (i,j) 的 数量 。 在 图 14-7 中 ， 
ko=1，kio=0。 图 14-8 列 出 了 图 14-7 的 所 有 交叉 及 占 的 值 。 表 的 
第 i 行 首先 是 的 值 ， 然 后 是 j 的 值 ， 其 中 i<j， 线 路 与 了 相交 。 
交叉 的 总 数 K 是 所 有 ;的 和 。 在 本 例 中 ，K=22。 因 为 ;计数 的 是 
路 线 i 和 其 右 侧 线路 的 交叉 ( 即 i<j )， 所 以 给 出 的 线路 右 侧 的 线 
路 交叉 数 。 

2. 分 布 交 又 

为 了 使 通道 的 上 半 部 和 下 半 部 的 布线 平衡 ， 我 们 要 求 每 一 部 分 含有 数量 大 致 相同 的 交叉 
(上 半 部 应 该 有 |K/2| 次 交 又 ， 下 半 部 应 该 有 |K2| 次 交叉 )。 图 14-9 是 图 14-7 的 一 种 布线 ， 每 
一 部 分 大 约 有 11 个 交叉 。 











目下 马 四 巴 


图 14-8 交叉 列表 





图 14-9 划分 交叉 
上 半 部 分 的 连接 由 排列 4=[1,4,6,3,7,2,9,5,10,8] 给 出 ， 即 顶部 的 针脚 i 与 中 间 的 针脚 4; 连 
接 。 下 半 部 分 的 连接 由 排列 B=[8,1,2,7,3,4,5,6,9,10] 给 出 ， 中 间 的 针脚 i 与 底部 的 针脚 8; 连 
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接 。 可 以 看 出 C=B4，1L < i < m 要 完成 C 给 出 的 连接 ， 满 足 这 个 等 式 是 必要 的 。 

本 节 我 们 要 设计 一 个 算法 ， 计 算 排 列 4 和 B,， 使 上 半 部 的 交 又 有 |[K/2| ， 其 中 天 是 交叉 
总 数 。 

3. 使 用 线性 表 实 现 的 分 布 交叉 

通过 考察 线路 (i,j))， 在 80 时 间 内 可 以 计算 出 点 和 天 。 程 序 14-12 用 线性 表 arrayList 
将 C 划 分 为 4 和 B。 


程序 14-12 ”使 用 线性 表 的 交叉 分 布 程序 


void main (void) 
{ 
/定义 要 解决 的 问题 实例 
/在 通道 底部 的 连接 点 theC[1:10] 


于 主攻 TNeOGL] SE HO Bs Tn Mi Zi Sn ly Bi Bs LO ‘Gh 
/交叉 数量 ，k[1:10] 
int kL] ss WO Ti 7 Bs li Zr Or Zi Ds dr QFs 
int 页 三 LOs // 在 通道 每 一 边 的 针脚 数量 
int theK = 22; /交叉 总 数量 
1/ 生成 数据 结构 
arrayList<int> theList (n); 
int *theA = new int[n + 1]， /顶端 的 排列 
*theB = new int[In + 1]， 1// 底 端的 排列 
*thexX = new intin + 1]; 1/ 中 间 的 排列 
int crossingsNeeded = theK / 2; 1/ 需要 在 上 半 部 分 保留 的 交 义 数 


// 从 右 到 左 扫描 线路 

int currentWire = n; 

while (crossingsNeeded > 0) 
{// 在 上 半 部 需要 更 多 的 交叉 

if (k[currentWire] < crossingsNeeded) 

{1/ 使 用 来 自 currentWire 的 所 有 交叉 
theList.insert(k[IcurrentWire], currentWire); 
crossingsNeeded -= k[currentWirel]; 

} 

else 

{1/ 仅 使 用 来 自 currentWire 的 crossingsNeeded 
theList.insert (crossingsNeeded, currentWire); 
crossingsNeeded = 0; 

} 

currentWire-—;} 


} 


/ 确定 中 间 的 线路 排列 

/第 一 个 线路 currentWire 次 数 相同 

for (int i = 1; i <= currentWire; I++) 
thex[i] = i; 


/剩余 线路 的 次 序 来 自 表 
for (int i = currentWire + 1; i <= n; i++) 
thex[i] = theList.get(i - currentWire - 1); 


1/ 计算 上 半 部 的 排列 


for (int 立 = 1 土 <= 
theA[theX[i]] = i; 


/ 计算 下 半 部 的 排列 
for (int i = 1 i <= n; i++) 
theB[i] = theC[ItheX[i]]; 


ett x "A Es ™ 

for (int i = 1; i <= n; i++) 
cout << theA[i] << " "; 

cout << endl; 


COuUt < TB le " 
fer (ia 七 1 = 1; i <= Ti 1) 
Cout < theB[lil] << “*" 
cout << endl; 
} 


在 while 循环 中 ， 从 右 到 左 扫描 线路 ， 以 确定 它们 在 布线 通道 中 间 的 相对 顺序 ， 目 的 是 
在 通道 中 间 产 生 一 个 布线 ， 使 得 在 布线 通道 的 上 部 分 正好 有 crossingsNeeded=theK/2 个 交叉 。 

用 线性 表 theList 记录 线路 在 通道 中 间 的 当前 次 序 。 当 考察 线路 currentWire 时 ， 可 以 把 
其 与 右 侧 线路 中 最 多 k[currentWire] 个 交叉 累计 分 配 到 上 半 部 分 。 第 一 个 交叉 是 与 theList 中 
第 0 条 线路 相交 产生 的 ， 第 二 个 交叉 是 与 theList 的 下 一 条 线路 相交 产生 的 ， 如 此 下 去 。 如 
果 将 与 currentWire 相交 的 k[currentWire] 条 线路 中 的 c 条 分 配 到 上 半 部 分 ， 那 么 这 条 线路 必 
定 与 theList 中 的 前 c 条 线路 相交 。 另 外 ， 从 currentWire 到 mn 的 次 序 也 通过 将 currentWire 插 
入 theList 中 的 第 c 条 线 之 后 得 到 。 注 意 ， 当 在 程序 14-12 的 while 循环 中 考察 currentWire 
时 ， 线 路 currentWire+1 到 n 已 经 在 theList 中 。 而 且 ， 由 于 k[currentWire] 不 会 超过 线路 
currentWire 右边 的 线路 数量 ， 因 此 在 考察 currentWire 时 ，theList 中 至 少 已 有 k[w] 条 线路 。 

在 程序 14-12 的 while 循 环 中 ， 当 考察 线路 currentWire 时 ， 它 右 侧 的 交叉 数 
量 k[currentWire] 只 要 小 于 crossingsNeeded， 都 分 配 到 上 半 部 区 域 ， 然 后 ， 剩 余 的 
crossingsNeeded 个 交叉 也 分 配 到 上 半 部 区 域 。 

当 while 循 环 终止 时 ， 布线 通道 中 间 的 线路 次 序 theX 就 建立 好 了 ， 线路 1 到 
currentWire 在 上 半 部 分 没有 交 义 。 因 此 在 这 部 分 中 不 必 改 变 它们 的 相对 次 序 。 因 此 
theX[1:currentWire]=[1，2，…，currentWire]。 余 下 的 线路 排序 由 线性 表 theList 给 出 。 程 序 
14-12 的 前 两 个 for 循环 便 是 构造 theX。 

4. 一 个 例子 

下 面 根据 图 14-7 的 列子 来 建立 theX。 先 将 线路 10 插入 theList， 得 到 theList=(10)。 没 有 
产生 交叉 。 接 下 来 把 线路 9 插入 theList， 得 到 theList=(10，9)。 这 时 在 上 半 部 分 产生 了 1 个 
交叉 。 然 后 将 8 插 人 第 心 个 元 素 后 边 ， 得 到 theList=(8，10，9)。 此 时 在 上 部 分 的 右边 交叉 
总 数 仍然 是 1。 将 7 插入 第 二 个 元 素 之 后 ， 上 半 部 分 有 2 个 交叉 ，theList 变 为 ( 8,10,7,9 )， 所 
需 的 相交 次 数 + 下 降 到 8。 当 6 插入 后 ,得 到 theList=(6，8，10，7，9), r=8。 线 路 5 插入 后 
产生 2 个 交叉 ，theList=(6，8，5，10，7，9), r=6。 线 路 4 插入 首 元 素 之 后 产生 一 个 交叉， 
theList=(6，4，8，5，10，7，9)，r=5。 线 路 3 插入 后 ,得 到 theList=(6，4，8，3， 5，10，7， 
9), r=2。 最 后 考虑 线路 2。 虽 然 它 能 产生 k=6 个 交叉 ,但 只 能 将 其 中 2 个 分 配 到 通道 的 上 半 
部 分 ， 因 此 它 被 插入 theList 第 二 个 元 素 的 右边 ， 得 到 theList=(6, 4, 2, 8, 3, 5, 10, 7, 9)。 
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剩 下 的 路 线 保持 它们 的 相对 次 序 。 

在 完成 上 半 部 分 的 布线 之 后 ， 计 算 线 路 的 排列 ， 通 过 在 序列 (1，2，…，w) 上 附加 
theList 得 到 theX=[1, 6, 4, 2, 8, 3, 5, 10, 7, 9]。 

排列 theA=A 与 theX 关系 密 切 。theA[j] 表明 线路 j 应 该 连接 到 中 间 的 哪个 针脚 上 ， 而 
theX[i] 表明 哪 一 条 线路 连接 到 中 间 的 针脚 上 上。 程序 14-12 中 的 第 三 个 for 循环 就 是 用 这 种 信息 
来 计算 theA 的 。 如 同 在 第 四 个 for 循环 中 一 样 ， 利 用 theX 和 theC 计算 出 theB=B。 

5. 复杂 性 分 析 

将 一 个 元 素 插 入 大 小 为 s 的 线性 表 中 所 需要 的 时 间 是 O(s)， 因 此 程序 14-12 的 while 循 
环 需要 时 间 O(m*)。 其 他 代码 需要 时 间 O(n)， 因 此 整个 程序 14-12 的 复杂 性 是 O(m*)。 将 程序 
14-12 需要 的 时 间 与 计算 theK 和 k[i] 所 需要 的 时 间 联 系 在 一 起 可 知 ， 使 用 线性 表 解 决 交叉 问 
题 所 需要 的 全 部 时 间 是 O(n7)。 

使 用 平衡 搜索 树 来 代替 线性 表 ， 可 以 把 解决 方案 的 复杂 性 降低 到 O(nlogn)， 为 了 得 到 平 
均 复 杂 性 O(nlogn)， 可 以 使 用 索引 二 又 搜 索 树 ， 而 非 索引 平衡 搜索 树 。 这 两 情况 在 技术 上 是 
相同 的 ， 下 面 将 用 索引 二 又 搜索 树 来 说 明 此 技术 。 

6. 使 用 索引 二 又 搜索 树 

首先 来 看 如 何 计算 交 又 数 k;，1 < i < ns。 假定 按照 次 序 n，n-1,，…，1 来 检查 线路 ， 并 
且 当 检查 线路 i 时 ,将 Ci; 插入 索引 二 又 搜索 树 中 。 以 图 14-7 为 例 ， 开 始 时 索引 二 又 搜索 树 为 
空 。 检 查 线 路 10， 并 将 C10=6 插入 空 树 中 ， 得 到 图 14-10a。 节 点 外 侧 的 数字 是 其 leftSize 值 ， 
节点 内 测 的 数字 是 其 关键 字 (或 C 的 值 )。 注 意 , ,总 是 零 ， 因 此 今 =0。 下 一 个 检查 线路 
9， 并 将 Cs=10 插 入 树 中 ， 得 到 图 14-10b。 因 为 是 插入 根 的 右 子 树 ， 而 由 根 的 leftSize 值 可 
知 ， 线 路 9 的 底部 针脚 正好 在 一 个 针脚 的 右边 ， 所 以 如 =1。 下 一 个 检查 线路 8， 将 Cs=3 插入 
树 中 ， 得 到 图 14-10c。 由 于 Cs 是 树 中 最 小 元 素 ， 因 此 没有 线路 交叉 ， 于 是 ks=0。 对 于 线路 
7，C7=9 被 插入 后 得 到 图 14-10d。 对 进入 其 右 子 树 的 各 节点 的 leftSize 值 累 计 求 和 和， 可 以 确 
定 C; 是 树 中 第 三 小 的 元 素 。 由 此 得 知 ， 它 的 底部 针脚 位 于 树 中 其 他 2 个 针脚 的 右边 ， 因 此 ， 
已 =2。 按 此 方法 进行 下 去 ， 当 检查 线路 6 至 2 时 ， 结 果 分 别 如 图 14-10e 至 图 14-10i 所 示 。 最 
后 ， 检 查 线路 1， 将 C1=8 插入 树 中 ， 作 为 关键 字 为 7 的 节点 的 右 孩子 ， 进 入 右 子 树 的 各 节点 
的 leftSize 值 之 和 是 6+1=7， 线 路 1 的 底部 针脚 在 树 中 7 条 针脚 的 右边 ， 因 此 后 =7。 


Ue 
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图 14-10 ”计算 交叉 点 数量 


党 二 亡 分 数据 结 药 


检查 线路 i 和 计算 k; 所 需要 的 时 间 是 0(h)， 其 中 是 当前 索引 搜索 树 的 高 度 。 因 此 ， 
用 索引 二 又 搜索 树 可 用 平均 时 间 O(nlogn) 计算 出 所 有 的 k。 或 用 索引 平衡 搜索 树 在 时 间 
O(nlogn) 之 内 计算 出 所 有 的 后 。 

为 计算 A， 可 以 用 一 个 线性 表 的 索引 二 叉 搜索 树 描 述 来 实现 程序 14-12 的 代码 。 为 了 
按 次 序 排列 元 素 ， 可 以 进行 中 序 遍 历 。 使 用 练习 22 的 线性 表 ， 程 序 14-12 所 需要 的 时 间 为 
O(nlogn); 使 用 第 15 章 练习 20 的 索引 平衡 树 ， 最 坏 情 况 下 的 时 间 是 O(nlogn)。 


计算 排列 A 的 另 一 种 方法 是 ,首先 计算 ”= hk2 和 s= 最 小 i， 使 得 >h<r。 对 于 上 面 
的 例子 有 r=11 和 s=3。 程 序 14-12 实现 了 线路 n,n-1 ，-…, 8 的 所 有 交叉 ， 其 中 上 半 部 分 包 
含 线路 s-1 的- 个 相交 。 剩余 的 交叉 在 下 半 部 分 。 为 了 得 到 上 半 部 分 的 交叉 ， 对 插入 C。 


后 的 树 进行 检查 。 在 本 例 中 ， 检查 图 14-10h 中 的 树 。 对 树 的 中 序 遍 历 可 产生 序列 ( 1,2,3,4， 
5, 6, 9, 10 )。 用 相应 的 线路 编号 来 替换 这 些 底部 针脚 ， 可 得 到 序列 (6, 4, 8, 3, 5, 10,7, 9)， 
它 给 出 了 在 图 14-10h 中 描述 的 9 个 相交 线路 的 排列 。 对 于 另外 两 个 相交 ， 将 线路 s=2 插入 该 
序列 第 二 条 线路 之 后 ， 得 到 新 的 线路 序列 (6，4，2，8，3，5，10,， 7，9 )。 剩 下 的 线路 1 到 
s-1 加 到 序列 前 部 可 得 (1，6，4，2，8,， 3,， 5，10，7，9 )， 它 就 是 程序 14-12 所 计算 出 的 排 
列 theX。 为 了 用 这 种 方法 得 到 theX， 需 要 重新 运行 计算 ;的 部 分 代码 、 执 行 中 序 遍 历 、 插 入 
线路 s， 并 在 序列 之 前 增加 少量 线路 。 所 有 步骤 所 需要 的 时 间 是 O(n log n)。 程 序 14-12 的 最 
后 两 个 for 循环 可 在 线性 时 间 内 从 theX 中 得 到 theA 和 theB。 


练习 


23. 编写 一 个 直方 图 程序 : 首先 把 n 个 关键 字 输 入 到 一 个 数组 ， 然 后 排序 ， 最 后 从 左 到 右 扫描 
数组 并 输出 不 同 的 关键 字 及 其 出 现 的 次 数 。 

24. 编写 一 个 直方 图 程序 : 使 用 链 式 散 列 存储 不 同 关键 字 和 它们 的 频率 。 与 程序 14-9 比较 运 

行 时 间 。 
.1 ) 扩展 类 dBinarySearchTree : 增加 公有 方法 eraseGE(theKey)， 把 关键 字 >=> theKey 的 关 
键 字 最 小 的 元 素 删 除 ， 然 后 把 删除 的 元 素 返 回 。 

2 ) 使 用 eraseGE 设计 bestFitPack 的 新 版 本 。 

3 ) 哪 一 个 版 本 运行 更 快 ? 为 什么 ? 

为 排列 C[1:10]=[6,4,5,8,3,2,10,9,1,7] 设计 一 个 交叉 表 ( 参见 图 14-8 )。 计 算 上 半 部 和 下 半 

部 A 和 B 的 排列 ， 它 们 的 交叉 数量 是 均衡 的 。 

. 对 排列 C[1:10]=[10,9,8,1,2,3,7,6,5,4] 重 做 练习 26。 

. 1 ) 使 用 索引 二 又 搜索 树 ， 在 平均 时 间 O(nlogn) 内 求解 交叉 分 布 问 题 。 

2 ) 测试 你 的 代码 。 
3 ) 对 n=1000，10 000 和 50 000， 随 机 生成 排列 C， 然 后 与 程序 14-12 比较 交叉 分 布 问题 
的 实际 运行 时 间 。 

29. 编写 程序 ， 用 来 对 一 段 文本 创建 索引 表 ( 参考 第 10 章 练习 48 )。 使 用 二 又 搜索 树 组 织 索 
引 项 ， 然 后 通过 中 序 遍历 按 序 索引 项 。 分 析 在 组 织 索引 表 时 ， 二 又 搜索 树 法 和 散 列 法 的 优 
点 。 特 别 是 ， 当 文本 含有 nn 个 单词， 而 有 m < n 个 单词 不 同时 ， 比 较 这 两 种 方法 的 平均 
时 间 性 能 。 


2 


Ln 


2 


S 


之 
2 


oo ~] 


| 第 15 章 


Data Structures, Algorithms. and Applications in C++, Second Fdition 


平衡 搜索 树 





概述 


本 章 是 关于 树 的 最 后 一 章 ， 它 包括 平衡 树 结 构 ， 树 的 高 度 是 O(logn)。 其 中 有 两 种 平衡 二 
叉 树 结构 一 一 AVL 和 红 - 黑 树 ， 一 个 树 结构 一 一 B- 树 ， 它 的 度 大 于 2。AVL 和 红 - 黑 树 适合 
内 部 存储 的 应 用 ，B- 树 适 合 外 部 存储 的 应 用 ( 例如 ， 存 储 在 磁盘 上 的 大 型 词典 )。 这 些 平衡 
树 结 构 可 以 在 最 坏 情况 下 用 时 O(logn) 实现 字典 操作 和 按 名 次 的 操作 。 当 用 索引 平衡 树 表 示 线 
性 表 时 ， 操 作 get、insert 和 erase 的 用 时 为 O(logn)。 

分 裂 树 是 本 章 包 含 的 另 一 个 数据 结构 。 虽 然 分 裂 树 的 高 度 是 O(n)， 而 且 在 分 裂 树 上 的 单 
个 字典 操作 用 时 为 O00)， 但 是 每 一 个 含有 2 个 操作 的 序列 ， 其 用 时 仅 为 O(ulogu)。 不 论 使 用 
分 裂 树 、AVL 或 红 - 黑 树 ， 这 种 操作 序列 的 渐 近 时 间 复 杂 性 是 一 样 的 。 | 











下 面 的 表 总 结 了 在 本 章 中 各 种 字典 结构 的 渐 近 时 间 性 能 ， 其 中 的 函数 都 是 @ 的 。 




















有 序数 组 
有 序 链 表 
跳 表 
哈 希 表 
二 又 搜索 树 
AVL 树 
红 - 黑 树 
分 裂 树 
B- 树 
STL 类 map 和 multimap 使 用 的 是 红 - 黑 树 结构 ， 以 保证 查找 、 插 入 和 删除 操作 具有 对 

数 级 的 时 间 性 能 。 

在 实际 应 用 中 ， 当 我 们 要 实施 的 操作 都 是 按 关键 字 进 行 查找 、 插 人 和 删除 时 ， 我 们 认为 
散 列 技术 在 性 能 方面 超过 了 平衡 搜索 树 ， 因 此 ， 我 们 优先 选择 散 列 技术 。 如 果 我 们 是 按 关 键 
字 实 施 字典 操作 ， 而 且 操 作 时 间 不 能 超过 指定 的 范围 ， 这 时 我 们 提倡 使 用 平衡 搜索 树 。 对 于 
那些 按 名 次 实施 的 查找 和 删除 操作 ， 还 有 那些 不 按 精确 的 关键 字 匹 配 所 进行 的 字典 操作 ( 例 
如 寻找 关键 字 大 于 大 的 最 小 元 素 )， 我 们 建议 使 用 平衡 搜索 树 。 

关于 实际 的 运行 时 间 性 能 ，AVL 和 红 - 黑 树 是 相似 的 ; 相 比 之 下 ， 分 裂 树 在 实施 一 个 含 
有 2 个 操作 的 序列 时 ， 用 时 比较 少 。 另 外 ， 分 裂 树 的 实现 方法 比较 简单 。 

AVL 树 和 红 - 黑 树 都 使 用 “旋转 ”来 保持 平衡 。AVL 树 对 每 个 插入 操作 最 多 需要 一 次 
旋转 ， 对 每 个 删除 操作 最 多 需要 O(logn) 次 旋转 。 而 红 - 黑 树 对 每 个 插 和 信和 删除 操作 ， 都 只 
需要 一 次 旋转 。 这 种 差别 在 大 多 数 应 用 中 无 关 紧 要 ， 因 为 一 次 旋转 仅 需 用 时 @(1)。 但 是 对 那 
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些 需 要 平衡 的 应 用 ， 一 次 旋转 不 能 在 常量 时 间 内 完成 ， 这 种 差别 就 非常 重要 了 。 例 如 , 平衡 
优先 搜索 树 McCreight 就 是 这 样 一 种 应 用 。 平 衡 优 先 搜索 树 用 于 描述 具有 二 维 关 键 字 的 元 素 ， 
此 时 ， 每 个 关键 字 是 一 数 对 (x,y )。 它 是 关于 了 的 优先 队列 ， 同 时 又 是 关于 x 的 搜索 树 。 在 这 
样 的 树 中 ， 每 一 次 旋转 都 需 耗 时 O(logn)。 如 果 用 红 - 黑 树 来 描述 平衡 优先 搜索 树 ， 则 因为 每 
一 次 插入 或 删除 仅 需 要 执行 一 次 旋转 ， 所 以 插入 或 删除 操作 的 总 时 间 仍 保持 为 O(logn)。 当 使 
用 AVL 树 时 ， 则 删除 操作 的 时 间 将 变 为 O(log n)。 

虽然 对 比较 小 的 可 以 在 内 存 中 处 理 的 字典 ，AVL 树 、 红 - 黑 树 和 分 裂 树 均 能 提供 比较 高 
的 性 能 ， 但 是 对 大 型 字典 ， 它 们 就 不 适用 了 。 当 字典 存储 在 磁盘 上 时 ， 需 要 使 用 度数 更 大 、 
高 度 更 小 的 搜索 树 ， 例 如 本 章 将 介绍 的 B- 树 。 

对 本 章 的 数据 结构 没有 给 出 C+ 代码。 不过， 若干 代码 和 练习 答案 可 以 在 本 书 网 站 上 
得 到 。 而 且 本 书 网 站 还 包括 其 他 搜索 树 的 材料 ， 例 如 ， 单 词 查找 树 (tries ) 和 后 缀 树 ( suffix 
tree )。 

因为 平衡 搜索 树 和 第 14 章 的 二 又 搜索 树 的 应 用 是 一 样 的 ， 所 以 本 章 没 有 应 用 一 节 。 对 
14 章 的 应 用 ， 使 用 平衡 搜索 树 在 最 坏 情 况 下 的 渐 近 时 间 性 能 ， 与 使 用 非 平 衡 二 又 搜索 树 的 平 
均 时 间 性 能 是 一 样 的 。 


15.1 AVL 树 
志和 .1 证 芝 


如 果 搜 索 树 的 高 度 总 是 O(logn)， 我 们 就 能 保证 查找 、 插 入 和 删除 的 时 间 为 O(logn)。 最 
坏 情况 下 的 高 度 为 O(logn) 的 树 称 为 平衡 树 (balanced tree )。 比 较 流行 的 一 种 平衡 树 是 AVL 
树 ( AVL tree )， 它 是 Adelson-Velskii 和 Landis 在 1962 年 提出 的 。 

定义 15-1 一 棵 空 的 二 又 树 是 AVL 树 ; 如 果 了 是 一 棵 非 室 的 二 又 树 ，TL 和 TR 分 别 是 
其 左 子 树 和 右 子 树 ， 那 么 当 了 满足 以 下 条 件 时 ,TT 是 一 棵 AVL 树 : 1 ) TL 和 Tr 是 AVL 树 ; 
2 ) |hi-ha| 三 1， 其 中 有 和 hr 分 别 是 TL 和 TR 的 高 。 

一 棵 AVL 搜索 树 既 是 二 又 搜索 树 ， 也 是 AVL 树 。 图 14-1a 和 图 14-1b 是 AVL 树 ， 而 
图 14-1c 不 是 。 图 14-1a 不 是 AVL 搜索 树 ， 因 为 它 不 是 二 又 搜索 树 。 图 14-1b 是 AVL 搜索 
树 ， 图 14-3 是 AVL 搜索 树 。 

一 棵 索引 AVL 搜索 树 既 是 索引 二 又 搜索 树 ， 也 是 AVL 树 。 图 14-2 的 搜索 树 都 是 索引 
AVL 搜索 树 。 本 节 将 不 再 明确 地 介绍 索引 AVL 搜索 树 。 但 是 ， 我 们 讨论 的 方法 可 以 直接 应 用 
到 索引 AVL 搜索 树 。 对 术语 insert 和 put 与 remove 和 delete， 我 们 交互 使 用 。 

如 果 用 AVL 搜索 树 来 描述 字典 ， 并 在 对 数 级 时 间 内 完成 每 一 种 字典 操作 ， 那 么 ， 我 们 必 
须 确 定 AVL 树 的 下 述 特征 : 

1 ) 一 棵 n 个 元 素 的 AVL 树 ， 其 高 度 是 O(logn)。 

2 ) 对 于 每 一 个 n，n 二 0， 都 存在 一 棵 AVL 树 。 

3 ) 对 一 棵 nn 元素 的 AVL 搜索 树 ， 在 0O( 高 度 )=O(logn) 的 时 间 内 可 以 实现 查找 。 

4 ) 将 一 个 新 元 素 插 入 一 棵 元 素 的 AVL 搜索 树 中 ， 可 以 得 到 一 棵 +1 个 元 素 的 AVL 
树 ， 而 且 播 入 用 时 为 O(logn)。 

5 ) 一 个 元 素 从 一 棵 元 素 的 AVL 搜索 树 中 删除 ， 可 以 得 到 一 棵 二 1 个 元 素 的 AVL 树 ， 
而 且 删 除 用 时 为 O(logn)。 
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特征 2 ) 可 以 从 特征 4) 推出 ， 因 此 可 以 省 略 。 特 征 1 )、3 )、4 ) 和 5 ) 将 在 下 面 证 实 。 
15.1.2 ”AVL 树 的 高 度 


对 一 棵 高 度 为 h 的 AVL 树 , 令 NM 是 其 最 少 的 节点 数 。 在 最 坏 情 况 下 ， 根 的 一 棵 子 树 的 

高 度 是 h-1， 男 一 棵 子 树 的 高 度 是 h-2， 而 且 两 棵 子 树 都 是 AVL 树 。 因 此 有 : 
N=Ns_itNs_2+l1, No=0 HL Ni1=1 
注意 ，N, 的 定义 与 斐 波 那 契 数 列 的 定义 是 相似 的 : 
F,=F,_itF hn_2s Fo=0 且 Fi=1 

也 可 以 这 样 来 表示 : Ni=Fi42-1, hh 三 0( 见 练习 9)。 由 斐 波 那 契 定理 可 知 ， gg*/Y5 
， 其 中 yj =(1+V5)/2 。 因 此 N = 8"*?/Y5 一 1。 如 果树 中 有 n 个 节点 ， 那 么 树 的 最 大 高 度 为 : 
logs (V5 (n+1)) -2 1.44log(n+2)= O(logn)。 


15.1.3” AVL 树 的 描述 


AVL 树 一 般 用 链表 描述 。 但 是 ， 为 简化 插入 和 删除 操作 ,我们 为 每 个 节点 增加 一 个 平衡 
因子 bf。 节 点 x 的 平衡 因子 bf(x) 定义 为 : 

x 的 左 子 树 高 度 -x 的 右 子 树 高 度 

从 AVL 树 的 定义 可 以 知道 , 平衡 因子 的 可 能 取 值 为 -1、0 和 1。 图 15-1 是 两 棵 带 有 平衡 
因子 的 AVL 搜索 树 。 





a) b) 
每 个 节点 外 侧 的 数字 是 该 节点 的 平衡 因子 


图 15-1 AVL 搜索 树 


15.1.4 ”AVL 搜索 树 的 搜索 


程序 14-4 不 做 任何 修改 就 可 用 于 AVL 搜索 树 的 搜索 。 因 为 n 元 素 AVL 树 的 高 度 是 
O(logn)， 所 以 搜索 时 间 为 O(logn)。 


15.1.5 ” AVL 搜索 树 的 插入 


如 果 用 程序 14-5 的 方法 将 元 素 插 人 AVL 搜索 树 中 ,结果 可 能 不 再 是 AVL 树 。 例 如 ， 把 
一 个 关键 字 为 32 的 元 素 插入 图 15-1a 的 AVL 树 中 ， 结 果 如 图 15-2a 所 示 ， 其 中 节点 的 平衡 因 
子 不 是 -1、0 和 1， 因此 它 不 是 AVL 树 。 使 用 程序 14-5 的 策略 在 一 个 AVL 树 中 插入 一 个 节 
点 所 生成 一 棵 搜索 树 ， 如 果 它 有 一 个 或 更 多 的 节点 其 平衡 因子 不 再 是 -1、0 和 1 那么 这 样 的 
搜索 树 就 是 不 平衡 的 。 通 过 移动 不 平衡 树 的 子 树 可 以 恢复 平衡 ， 如 图 15-2b 所 示 。 

为 了 恢复 平衡 ， 在 移动 子 树 之 前 ,我 们 先 观 察 一 下 由 插入 操作 导致 不 平衡 的 几 种 情形 : 
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a) 刚 插入 时 b) 重新 平衡 之 后 
图 15-2 向 AVL 搜索 树 中 插 人 元 素 


11: 在 不 平衡 树 中 ， 平 衡 因子 的 值 限 于 -2，-1，0，1 和 2。 

12 : 平衡 因子 为 2 的 节点 在 插入 前 的 平衡 因子 为 1。 类 似 的 ,平衡 因子 为 -2 的 节点 在 插 
入 前 的 平衡 因子 为 -1。 

13: 只 有 从 根 到 新 插入 节点 的 路 径 上 的 节点 ， 其 平衡 因子 在 插入 后 会 改变 。 

I4 : 假设 4 是 离 新 插入 节点 最 近 的 祖先 ， 且 平衡 因子 是 -2 或 2 (在 图 15-2a 中 ,4 是 关 
键 字 为 40 的 节点 )， 在 插入 前 ， 从 4 到 新 插入 节点 的 路 径 上 ， 所 有 节点 的 平衡 因子 都 是 0。 

当 我 们 从 根 节点 往 下 移动 寻找 插入 新 元 素 的 位 置 时 ， 能 够 确定 14) 中 的 4。 从 了 I2 知 ， 
bf(4) 在 插 人 前 的 值 既 可 以 是 -1， 也 可 以 是 1。 设 是 最 后 一 个 具有 这 种 平衡 因子 的 节点 。 当 
把 32 插 入 图 15-1a 的 AVL 树 中 时 ,天 是 关键 字 为 40 的 节点 ; 当 把 22、28 或 50 插 入 图 15-1b 
的 AVL 树 中 时 , 了 是 关键 字 为 25 的 节点 ; 当 把 10、14、16 或 19 插 人 图 15-1b 的 AVL 树 中 时 ， 
这 样 的 节点 天 不 存在 。 

如 果 节 点 不 存在 ， 那么 从 根 节点 至 新 插入 节点 的 途径 中 ， 所 有 节点 在 插入 前 的 平衡 因 
子 都 是 0。 由 于 插入 操作 只 会 使 平衡 因子 增 减 0 或 1， 并 且 只 有 从 根 节点 至 新 插入 节点 的 途径 
中 的 节点 的 平衡 因子 会 被 改变 ， 所 以 插入 后 ， 树 的 平衡 不 会 被 破坏 。 因 此 ， 只 有 插入 后 的 树 
是 不 平衡 的 ，X 才 存在 。 如 果 插 入 后 bf(X)=0， 那 么 以 闻 为 根 节点 的 子 树 的 高 度 在 插入 前 后 是 
相同 的 。 例 如 ， 如 果 插 入 前 的 高 度 是 h， 且 4b/(X) 为 1， 那么 , 了 的 左 子 树 高 度 庆 是 h-1, 硬 
子 树 高 度 Xk 是 h-2 (如 图 15-3a 所 示 )。 为 了 使 平衡 因子 为 0， 必 须 在 Xr 中 做 插入 ， 得 到 高 
度 为 h-1 的 新 子 树 Xk( 如 图 15-3b 所 示 )。 由 于 从 闫 到 新 插入 节点 的 路 径 中 的 所 有 节点 在 插 
入 前 的 平衡 因子 均 为 0， 所 以 X% 的 高 度 必须 增加 到 h-1。X 的 高 度 仍 保持 为 h,， XX 的 祖先 的 平 
衡 因 子 在 插入 前 后 保持 相同 ， 这 样 ， 树 的 平衡 被 保持 住 了 。 


总 芝 bg 
XL Xk 区 和 Xk 4 六 
h-l h-2 hl h-2 h h-2 


a) 插入 之 前 b) 插入 久之 后 c) 插入 五 之 后 
节点 X 内 部 的 数字 是 平衡 因子 ， 子 树 名 称 下面 的 是 子 树 高 度 
图 15-3 AVL 搜索 树 的 插入 
一 棵 树 从 平衡 变 为 不 平衡 的 唯一 过 程 是 : 在 插入 操作 之 后 ,平衡 因子 bf(%) 的 值 由 -1 


变 为 -2， 或 者 由 1 变 为 2。 后 一 种 情况 只 有 在 的 左 子 树 站 中 进行 插入 时 才 会 出 现 ( 如 
图 15-3c 所 示 )。 这 时 ，2 的 高 度 一 定 变 为 h ( 因为 在 插 和 人 前， 从 式 到 新 插入 节点 的 途径 中 的 
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所 有 节点 的 平衡 因子 都 为 0)。 因 此 ，1I4 中 4 就 是 节点 所 

节点 4 的 不 平衡 情况 有 两 类 : 工 型 不 平衡 (新 插入 节点 在 4 的 左 子 树 中 ) 和 RR 型 不 平衡 。 
在 从 根 到 新 插入 节点 的 路 径 上 ， 根据 4 的 孙 节 点 情况 ,4 的 不 平衡 情况 还 可 以 细 分 。 注 意 ， 
包含 新 节点 的 4 的 子 树 高 度 至 少 是 2，4 的 平衡 因子 是 -2 或 2，4 才 存 在 这 样 的 孙 节 点 。4 的 
不 平衡 类 型 的 细 分 是 : LL ( 新 插入 节点 在 4 节点 的 左 子 树 的 左 子 树 中 )，LR (新 插入 节点 在 
4 节点 的 左 子 树 的 右 子 树 中 )，RR 和 RL。 





b) 插入 Bi 之 后 c) LL 旋转 之 后 


节点 内 的 数字 是 平衡 因子 ， 子 树 名 称 下 面 的 是 子 树 高 度 
图 15-4 LL 旋转 


图 15-4 是 一 种 普通 的 LL 型 不 平衡 。 图 15-4a 是 插入 前 的 条 件 ， 图 15-4b 是 在 节点 
B 的 左 子 树 BL 中 插入 一 个 元 素 后 的 情形 。 恢 复 平衡 所 进行 的 子 树 移动 如 图 15-4c 所 示 。 
原来 以 4 为 根 节 点 的 子 树 ， 现 在 以 B 为 根 节点 ,Bi 仍然 是 B 的 左 子 树 ，4 变 成 B 的 右 
子 树 的 根 ，Br 变 成 4 的 左 子 树 ，4 的 右 子 树 不 变 。 随 着 4 的 平衡 因子 的 改变 ， 在 从 B 到 
新 插入 节点 的 路 径 上 ，B'1 的 所 有 节点 的 平衡 因子 都 要 改变 。 其 他 节点 的 平衡 因子 与 旋转 
前 的 一 致 。 因 为 图 15-4a 和 图 15-4c 的 子 树 的 高 度 是 一 样 的 ， 所 以 它们 的 祖父 节点 如 果 存 
在 的 话 ， 其 平衡 因子 与 插入 前 是 一 样 的 。 因 此 所 有 节点 的 平衡 因子 都 是 -1、0 或 1。 仅 仅 
一 个 LL 旋转 就 使 整个 树 重新 获得 平衡 吗 ! 你 可 以 证 明 重 新 平衡 后 的 树 确 实 是 一 棵 二 叉 搜 
索 树 。 

图 15-5 给 出 了 一 种 普通 的 LR 型 不 平衡 。 因 为 插入 操作 发 生 在 B 的 右 子 树 ， 所 以 这 棵 
子 树 在 插入 后 不 可 能 为 空 ， 因 此 节点 C 是 存在 的 。 但 是 , C 的 子 树 Cr 和 CR 有 可 能 为 空 。 
为 了 恢复 平衡 ,， 需 要 对 子 树 进行 重新 整理 ， 如 图 15-5c 所 示 。 重 新 整理 后 ，4bf(B) 和 bf(4) 的 
值 取决 于 bf(OC) 在 插入 之 后 、 重 新 整理 之 前 的 值 bp。 重 新 整理 后 的 子 树 仍 是 二 又 搜索 树 。 另 
外 ， 因 为 图 15-5a 和 图 15-5c 的 子 树 的 高 度 是 相同 的 ， 所 以 它们 的 祖先 如 果 存 在 ， 其 平衡 因 
子 在 插入 前 与 在 插入 后 也 是 相同 的 。 因 此 ， 在 节点 4 的 一 个 LR 旋转 即 可 完成 整个 树 的 重新 
平衡 。 

RR 和 RL 与 上 面 所 讨论 的 情形 是 对 称 的 。 我 们 把 矫正 LL 和 RR 型 不 平衡 所 做 的 转换 
称 为 单 旋 转 (single rotation )， 把 矫正 LR 和 RL 型 不 平衡 所 做 的 转换 称 为 双 旋 转 (double 
rotation )。 对 LR 型 不 平衡 所 做 的 双 旋 转 可 以 看 做 RR 旋转 加 LL 旋转 ， 而 对 RL 型 不 平衡 所 
做 的 双 旋 转 可 以 看 做 LL 旋转 加 RR 旋转 ( 练习 13 )。 

根据 上 述 讨 论 ， 对 AVL 搜索 树 实 施 插 入 操作 的 步骤 如 图 15-6 所 示 。 这 些 步骤 可 以 细 化 
为 C++ 代码， 其 复杂 性 为 O( 高 度 )=O(logn)。 注 意 ， 如 果 插 入 导致 不 平衡 ， 那 么 一 次 单 步 旋 
转 (LL,LR,RR 和 RL ) 便 可 以 恢复 平衡 。 
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a) 插入 之 前 b) 插入 Br 之 后 c) LR 旋转 之 后 


b=0 志 bf(B8)= bf(4)=0 旋转 后 
b=1 志 bh/(B8)=0，b/(4)=-1 旋转 后 
b=-l1 志 bf(8)=1，b/(4)=0 旋转 后 


图 15-5 ”LR 旋转 








步骤 1): 沿 着 从 根 节点 开始 的 路 径 ， 根据 新 元 素 的 关键 字 ， 去 寻找 新 元 素 
的 插入 位 置 。 在 此 过 程 中 , 记录 最 新 发 现 平衡 因子 为 -1 或 1 的 节点 , 并 令 其 
为 4 节点 。 如 果 找 到 了 具有 相同 关键 字 的 元 素 , 那么 插入 失败 , 终止 算法 。 

步骤 2): 如 果 在 步骤 1) 中 所 描述 的 节点 4 不 存在 , 那么 从 根 节点 开始 沿 着 
原 路 径 修 改 平衡 因子 , 然后 终止 算法 

步骤 3): 如 果 bf(4)=1 并 且 新 节点 插入 4 的 右 子 树 中 , 或 者 8/(4)=-1 并 且 
新 节点 插入 到 左 子 树 , 那么 4 的 平衡 因子 是 0。 在 这 种 情况 下 , 修改 从 4 到 新 
节点 途中 的 平衡 因子 , 然后 终止 算法 。 

步骤 4): 确定 4 的 不 平衡 类 型 并 执行 相应 的 旋转 ,并 对 新 子 树 根 节点 至 新 
插入 节点 的 路 径 上 的 节点 的 其 平衡 因子 做 相应 的 修改 。 


15-6 ”AVL 搜索 树 的 插入 步骤 











15.1.6 ”AVL 搜索 树 的 删除 


执行 程序 14-6， 可 从 AVL 搜索 树 中 删除 一 个 元 素 。 设 9 是 被 删除 节点 的 父 节 点 。 例 如 ， 
如 果 要 删除 图 15-1b 中 关键 字 为 25 的 元 素 ， 那 么 该 元 素 的 节点 被 删除 ， 并 且 根 节点 的 右 孩 子 
指针 指向 被 删除 节点 的 唯一 孩子 。 因 为 根 节 点 是 被 删除 节点 的 父 节 点 ， 所 以 4 就 是 根 节点 。 
如 果 要 删除 的 是 关键 字 为 15 的 元 素 ， 那 么 该 元 素 的 节点 将 被 关键 字 为 12 的 元 素 所 占用 ， 而 
12 的 原 节点 被 删除 。 这 时 的 9 是 原 15 的 节点 〈 根 的 左 孩 子 )。 因 为 一 个 节点 删除 之 后 ， 从 根 
到 的 路 径 上 的 一 些 节点 或 全 部 节点 的 平衡 因子 都 改变 了 了 ， 所 以 要 从 9 沿 原 路 折 回 。 

如 果 删 除 发 生 在 4 的 左 子 树 ， 那 么 bf(q) 减 1。 如 果 删 除 发 生 在 g 的 右 子 树 ， 那 么 bf(q) 
加 1。 下面 是 删除 的 几 种 情形 : 

D1: 如 果 9 的 新 平衡 因子 是 0， 那么 它 的 高 度 减 少 了 1， 这 时 需要 改变 它 的 父 节点 ( 如 果 
有 的 话 ) 的 平衡 因子 ， 而 且 可 能 需要 改变 其 他 祖先 节点 的 平衡 因子 。 

D2: 如 果 q 的 新 平衡 因子 是 -1 或 1， 那 么 它 的 高 度 与 删除 前 相同 ， 而 且 无 需 改 变 其 祖先 
的 平衡 因子 值 。 

D3: 如 果 gq 的 新 平衡 因子 是 -2 或 2， 那 么 树 在 gq 处 是 不 平衡 的 。 

从 g 到 根 节点 的 路 径 上 ， 节 点 的 平衡 因子 可 能 发 生 很 大 变化 ( 见 D1 )， 有 的 节点 的 平衡 
因子 有 可 能 变 为 -2 或 2。 令 4 是 第 一 个 这 样 的 节点 。 要 恢复 4 节点 的 平衡 ， 需 要 根据 不 平衡 
的 类 型 而 定 。 如 果 删 除 发 生 在 4 的 左 子 树 ， 那 么 不 平衡 类 型 是 工 型 ; 否则 ， 不 平衡 类 型 就 是 
R 型 。 如 果 在 删除 后 ，b/(4)=2， 那 么 在 删除 前 ，4/(4) 的 值 一 定 为 1。 因 此 ，4 有 一 棵 以 B 为 
根 的 左 子 树 。 根 据 bf(8) 的 值 ， 可 以 把 一 个 R 型 不 平衡 细 分 为 R0，R1 和 R-1。 例如 ，R-1 型 
不 平衡 指 的 是 这 种 情况 : 删除 操作 发 生 在 4 的 右 子 树 并 且 bf(8)=-1。 类 似 的 ，L 型 不 平衡 也 
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可 以 细 分 为 LO、L1 和 工 -1。 
在 节点 4 的 RO 型 不 平衡 通过 图 15-7 的 旋转 来 矫正 。 注 意 ， 子 树 的 高 度 在 删除 前 和 删除 后 都 
是 ht2， 因 此 ， 到 根 节点 途径 上 的 剩余 节点 没有 改变 平衡 因子 ， 整 棵 树 在 一 次 旋转 后 获得 平衡 。 





4 全 ‘入 
ON ON 
h h-l 
有 Br Bi BR Br 4R 
有 h h h 有 h h h-l 
a) 删除 之 前 b)》 在 4 中 删除 后 c) RO 型 旋转 之 后 


图 15-7 R0 型 旋转 ( 单 旋转 ) 


图 15-8 显示 了 对 R1 型 不 平衡 的 处 理 。 当 指针 的 变化 与 RO 型 不 平衡 的 变化 相同 时 ，4 和 
8 的 新 平衡 因子 是 不 同 的 ， 并 且 旋 转 后 子 树 的 高 度 是 h+1， 比 删除 前 减少 了 1。 因 此 ， 如 果 4 
不 是 根 节 点 ， 它 的 某 些 祖先 的 平衡 因子 将 产生 变化 ， 可 能 需要 进行 旋转 以 保持 平衡 。R1 旋转 
后 ， 必 须 继续 检查 至 根 节点 路 径 上 的 节点 。 与 插入 情况 不 同 ， 在 一 次 删除 操作 之 后 ， 仅 用 一 
次 旋转 可 能 还 无 法 恢复 平衡 。 所 需要 的 旋转 次 数 为 O(logn)。 





B Ar 
h 
已 Br 
h h-l h hl hl hl 
a) 删除 之 前 b) 在 4 中 删除 后 c) R1 型 旋转 之 后 


图 15-8 RI 型 旋转 ( 单 旋转 ) 


R-1 型 不 平衡 所 需要 的 转换 如 图 15-9 所 示 。 节 点 4 和 B 在 旋转 后 的 平衡 因子 取决 于 B 
的 右 孩 子 的 平衡 因子 h。 这 次 旋转 得 到 了 一 棵 高 度 为 h+1 的 子 树 ， 而 删除 前 的 子 树 高 度 是 
h+2， 因 此 ， 在 至 根 节点 的 路 径 上 需要 继续 旋转 。 





站， 梳 GE 
hl h-l 





C. Cr 
a) 删除 之 前 b) 在 4 中 删除 后 c) R-1 型 旋转 之 后 
b=0 志 bf(4)=bf(8) = 0 旋转 后 
= 1 一 brd)=-1，gFB)= 0 旋转 后 
=-1 一 br4)=0， bfB)=1 旋转 后 





图 15-9 R-1 型 旋转 ( 双 旋 转 ) 
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LL 与 R1 类 型 的 旋转 相同 ; LL 与 R0 型 旋转 的 区 别 仅 在 于 4 和 B 最 后 的 平衡 因子 ; LR 
与 R-1 旋转 相同 。 


练习 


1. 从 一 棵 空 的 AVL 搜索 树 开 始 ， 依 次 插入 如 下 关键 字 : 15, 14, 13, 12, 11,10, 9, 8, 7, 6, 5， 
4，3，2，1。 模 仿 图 15-2 和 图 15-3， 夯 出 每 一 次 插入 和 旋转 调整 之 后 的 图 。 用 平衡 因子 标 
注 每 一 个 节点 ， 指 明 每 次 旋转 的 类 型 。 

2. 使 用 如 下 的 关键 字 : 1，2，3，4， 5,，6，,，7，,，8，,，9，10，11，12，13，14，15， 做 练习 1。 

3. 使 用 如 下 的 关键 字 : 20，10，5，30，40，3，4，25，23，27，50， 做 练习 1。 

4. 使 用 如 下 的 关键 字 : 40，5$0，70，30，20，45，25，10，5，22，1，35， 做 练习 1。 

5. 一 棵 AVL 搜索 树 是 具有 15 个 节点 的 完全 二 叉 树 ， 关 键 字 为 1-15。 按 如 下 顺序 删除 关键 
字 : 15，14，13，…，1。 画 出 每 一 次 删除 和 旋转 之 后 的 图 。 用 平衡 因子 来 做 节点 标识 ， 指 
明 每 次 旋转 的 类 型 。 

6. 再 做 练习 5， 不 过 删除 关键 字 的 顺序 是 : 1，2，3，…，15。 

7. 再 做 练习 5， 不 过 删除 关键 字 的 顺序 是 : 6, 7, 5, 10, 9, 11, 15, 12, 13, 1, 2, 3。 

8. 再 做 练习 5， 不 过 删除 关键 字 的 顺序 是 : 11, 14, 13, 15, 9, 2, 3, 1, 6, 5, 7。 

9. 用 数学 归纳 证 明 : 在 一 棵 高 度 为 hh 的 AVL 树 中 ,最少 的 节点 数 是 N;=Fi,s-1, hh 宇 0。 

10. 用 程序 14-5 的 方法 证 明 : 插入 操作 可 导致 不 平衡 树 的 情形 I1 ~ 14。 

11. 模仿 图 15-3， 根 据 插入 前 oO=-1 的 条 件 画 图 。 

12. 模仿 图 15-4 和 图 15-5， 为 RR 和 RL 不 平衡 画图 。 

13. 从 图 15-5b 所 示 的 LR 不 平衡 开始 ， 画 一 个 在 B 节 点 执行 一 个 RR 旋转 的 结果 示意 图 。 注 
意 ， 再 执行 一 次 LL 旋转 ， 即 可 得 到 图 15-5b。 

14. 模仿 图 15-7、 图 15-8 和 图 13-9， 为 LO、L1 和 L-1 不 平衡 情况 分 别 画 图 。 

15. 设计 一 个 C++ 类 avlTree， 它 派生 于 抽象 类 indexedBSTree ( 见 程序 14-2 )。 编 写 所 有 
方法 的 代码 并 检验 其 正确 性 。 方 法 find、get、insert、erase 和 delete 的 时 间 复 杂 性 应 为 
O(logn)。 方 法 ascend 的 时 间 复 杂 性 应 为 @(n)。 

16. 针对 如 下 情况 完成 练习 15 : 二 叉 搜索 树 有 若干 个 元 素 的 关键 字 相 同 。 新 类 的 名 称 为 
davlTree。 

17. 设计 一 个 C+t+ 类 indexedAVLtree， 它 包含 索引 二 又 搜索 树 的 如 下 函数 : find(theKey)、 

insert、delete(theKey)、get(theIndex)、erase(theKey) 和 ascend。 给 出 薄 数 的 全 部 代码 并 
检验 其 正确 性 。 前 5 个 函数 的 时 间 复 杂 性 应 是 O(logn)， 最 后 一 个 函数 的 时 间 复 杂 性 应 为 
O(n)。 

. 针对 如 下 情况 完成 练习 17 : 二 又 搜索 树 有 一 些 元 素 的 关键 字 相 同 。 新 类 的 名 称 为 
dIndexedAVLtree。 

.关于 8.5.3 节 的 火车 车 厢 重 排 问题 的 解决 方法 ， 如 何 用 AVL 树 将 其 渐 近 复杂 性 减少 到 
O(nlogk), 

. 设计 一 个 linearListAsIndexedAVLtree， 它 派生 于 抽象 类 linearList ( 程序 5-1 )， 参 考 第 14 
章 的 练习 21， 以 便 得 到 一 些 思路 。 除 函数 indexOf 以 外 ， 其 他 函数 的 运行 时 间 都 应 该 是 对 
数 级 或 更 少 。 

21. 把 程序 14-11 中 使 用 的 二 又 搜索 树 ， 替 换 为 带 有 重复 关键 字 的 AVL 搜索 树 。 在 箱子 装载 


一 
Do 
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0 
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问题 的 最 优 匹 配 法 中 ,测量 它们 性 能 。 
22. 1 ) 对 交叉 分 布 问题 ( 14.6.3 节 )， 使 用 索引 AVL 搜索 树 得 到 一 个 性 能 为 O(nlogn) 的 解 。 
2 ) 测试 你 的 代码 。 
3 ) 把 你 的 代码 的 实际 运行 时 间 与 14.6.3 节 的 程序 14-12 比较 ， 后 者 的 时 间 性 能 是 @(n”)。 
在 比较 中 ,使 用 随机 组 合 C， 而 且 n=1000，10 000 和 50 000。 


15.2 红 - 黑 树 
15.2.1 基本 概念 


红 - 黑 树 ( red-black tree ) 是 这 样 的 一 棵 二 又 搜索 树 : 树 中 每 一 个 节点 的 颜色 或 者 是 黑色 
或 者 是 红色 。 红 - 黑 树 的 其 他 特征 可 以 用 相应 的 扩充 二 又 树 来 说 明 。 回 忆 一 下 12.5.1 节 , 在 
一 棵 规则 二 又 树 中 ， 每 一 个 空 指 针 用 一 个 外 部 节点 来 替代 ， 由 此 得 到 一 棵 扩展 二 又 树 。 其 他 
的 性 质 还 有 : 

RB1: 根 节点 和 所 有 外 部 节点 都 是 黑色 。 

RB2: 在 根 至 外 部 节点 路 径 上 ， 没 有 连续 两 个 节点 是 红色 。 

RB3: 在 所 有 根 至 外 部 节点 的 路 径 上 ， 黑 色 节 点 的 数目 都 相同 。 

红 - 黑 树 还 有 另 一 种 等 价 ， 它 取决 于 父子 节点 间 的 指针 颜色 。 从 父 节 点 指向 黑色 孩子 的 
指针 是 黑色 的 ， 从 父 节点 指向 红色 孩子 的 指针 是 红色 的 。 另 外 还 有 : 

RB1': 从 内 部 节点 指向 外 部 节点 的 指针 是 黑色 的 。 

RB2': 在 根 至 外 部 节点 路 径 上 ， 没 有 两 个 连续 的 红色 指针 。 

RB3': 在 所 有 根 至 外 部 节点 路 径 上 ， 黑 色 指 针 的 数目 都 相同 。 

注意 ， 如 果 知 道 指 针 的 颜色 ， 就 能 推断 节点 的 颜色 ， 反 之 亦 然 。 在 图 15-10 的 红 - 黑 树 
中 ， 阴 影 的 方块 是 外 部 节点 ， 阴 影 的 圆圈 是 黑色 节点 ， 和 白色 圆圈 是 红色 节点 ， 粗 线 是 黑色 指 
针 ， 细 线 是 红色 指针 。 注 意 ， 在 每 一 条 根 至 外 部 节点 的 路 径 上 ， 都 有 两 个 黑色 指针 和 三 个 黑 
色 节 点 (包括 根 节点 和 外 部 节点 )， 且 不 存在 两 个 连续 的 红色 节点 或 指针 。 





图 15-10 红 - 黑 树 


令 红 - 黑 树 的 一 个 节点 的 阶 (rank )， 是 从 该 节点 到 一 外 部 节点 的 路 径 上 黑色 指针 的 数 
量 。 因 此 ， 一 个 外 部 节点 的 阶 是 零 ， 在 图 15-10 中 ， 根 节点 的 阶 是 2， 其 左 孩子 的 阶 是 2， 右 
孩子 的 阶 是 1。 

定理 15-1 设 从 根 到 外 部 节点 的 路 径 长 度 (length ) 是 该 路 径 上 的 指针 数量 。 如 果 已 和 
@ 是 红 - 黑 树 中 的 两 条 从 根 至 外 部 节点 的 路 径 ， 那 么 length(P) < 2length(O)。 

证 明 考察 任意 一 棵 红 - 黑 树 。 假 设 根 节点 的 阶 是 r。 由 RB1' 可 知 ， 在 每 条 从 根 至 外 部 
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节点 的 路 径 上 ， 最 后 一 个 指针 为 黑色 。 从 RB2' 可 知 ， 在 这 样 的 路 径 上 ， 没 有 两 个 连续 红色 的 
指针 ， 每 个 红色 指针 的 后 面 都 会 跟着 一 个 黑色 指针 。 因 此 ， 这 样 的 路 径 都 有 + ~ 27r 个 指针 ， 
故 有 length(P) < 2length(0)。 为 了 验证 上 限 的 可 能 性 ， 可 参考 图 15-10 的 红 - 黑 树 。 从 根 至 5 
的 左 孩 子 的 路 径 长 度 是 4， 而 到 80 的 右 孩 子 的 路 径 长 度 是 2。 

定理 15-2 令 有 是 一 棵 红 - 黑 树 的 高 度 (不 包括 外 部 节点 )，n 是 树 的 内 部 节点 数量 ,而 
rr 是 根 节点 的 阶 ， 则 

1)h2r, 

0) nS 2 

3) h < 2log2(n+1), 

证 明 由 定理 15-1 我 们 知道 ， 从 根 至 外 部 节点 的 路 径 的 长 度 不 会 超过 2r， 因 此 hh < 2r 
(在 图 15-10 中 ， 除 去 外 部 节点 的 红 - 黑 树 高 度 是 2r=4 )。 

因为 根 节点 的 阶 是 >， 所 以 从 第 1 层 至 第 r 层 没有 外 部 节点 ， 因 而 在 这 些 层 中 有 2 一 1 个 
内 部 节点 。 即 内 部 节点 的 总 数 至 少 应 为 2-1 (在 图 15-10 的 红 -~ 黑 树 中 , 第 1 和 2 层 的 内 部 
节点 数 共 有 2*-1=3 个 ， 而 第 3 和 4 层 还 有 其 他 内 部 节点 )。 

由 2) 可 以 得 到 ” < log2(n+1)。 这 个 不 等 式 与 1 ) 合 起 来 即 可 得 到 3 )。 男 

由 于 红 - 黑 树 的 高 度 最 多 是 2log2(n+1)， 所 以 ， 在 O(p) 时 间 内 可 以 完成 的 搜索 、 插 入 和 
删除 操作 ， 其 复杂 性 为 O(logn)。 

注意 ， 对 同样 多 的 内 部 节点 ， 在 最 坏 情况 下 ， 红 - 黑 树 高 度 大 于 AVL 树 的 高 度 ， 后 者 的 
高 度 近 似 于 1.44log2(n+2)。 


15.2.2 红 - 黑 树 的 描述 


在 红 - 黑 树 的 定义 中 包括 了 外 部 节点 ， 但 在 执行 过 程 中 ， 我 们 对 外 部 节点 仍然 用 空 指针 
来 描述 ， 而 不 是 用 物理 节点 来 描述 。 进 一 步 说 ， 因 为 指针 颜色 与 节点 颜色 是 紧密 联系 的 ， 所 
以 对 于 每 个 节点 ,需要 储存 的 只 是 该 节点 的 颜色 或 指向 它 的 两 个 孩子 的 指针 颜色 。 存 储 每 个 
节点 的 颜色 只 需要 附加 一 位 ， 而 存储 每 个 指针 的 颜色 则 需要 两 位 。 既 然 两 种 存储 方案 需要 的 
空间 几乎 相同 ， 那 么 选择 哪 种 方案 ， 应 该 由 红 - 黑 树 算法 的 实际 运行 时 间 来 决定 。 

在 插入 和 删除 操作 的 讨论 中 ， 只 对 节点 颜色 的 改变 做 明确 的 说 明 ， 相 应 的 指针 颜色 的 变 
化 可 由 推断 得 到 。 


15.2.3 红 - 黑 树 的 搜索 


可 以 使 用 普通 二 又 搜索 树 的 搜索 代码 ( 见 程 序 14-4 ) 来 搜索 红 - 黑 树 。 原 代码 的 复杂 性 
为 O(h)， 而 对 红 - 黑 树 来 说 ， 则 为 O(logn)。 由 于 对 普通 二 又 搜索 树 、AVL 树 和 红 - 黑 树 都 
用 相同 的 代码 ， 并 且 在 最 坏 情 况 下 AVL 树 的 高 度 是 最 小 的 ， 所 以 ， 在 那些 以 搜索 操作 为 主 的 
应 用 中 ， 在 最 坏 情况 下 AVL 树 的 时 间 复 杂 性 是 最 优 的 。 


15.2.4 红 - 黑 树 的 插入 


红 - 黑 树 的 插 人 操作 使 用 的 是 程序 14-5 所 示 的 普通 二 又 树 的 插入 算法 。 对 插 和 人 的 新 元 
素 ， 需 要 上 色 。 如 果 插 入 前 的 树 是 空 的 ， 那 么 新 节点 是 根 节 点 ， 颜 色 应 是 黑色 ( 参看 特征 
RB1 )。 假 设 插入 前 的 树 是 非 空 的 。 如 果 新 节点 的 颜色 是 黑色 ， 那 么 在 从 根 到 外 部 节点 的 路 径 
上 ， 将 有 一 个 特殊 的 黑色 节点 作为 新 节点 的 孩子 。 如 果 新 节点 是 红色 ,那么 可 能 出 现 两 个 连 
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续 的 红色 节点 。 把 新 节点 赋 为 黑色 将 肯定 不 符合 RB3， 而 把 新 节点 赋 为 红色 则 可 能 违反 ， 也 
可 能 符合 RB2， 因 此 ， 应 将 新 节点 赋 为 红色 。 

如 果 将 新 节点 赋 为 红色 而 引起 特征 RB2 的 破坏 ， 我们 就 说 树 的 平衡 被 破坏 了 。 不 平衡 的 
类 型 可 以 通过 检查 新 节点 w、 其 父 节点 pu 及 祖父 节点 gu 来 确定 。RB2 被 破坏 后 的 情况 便 是 
有 两 个 连续 的 红色 节点 : 一 个 是 w， 男 一 个 一 定 是 它 的 父 节 点 ， 因 此 pu 存在 。 因 为 pu 是 红 
色 的 ， 它 不 可 能 是 根 ( 根据 特征 RB1 )， 所 以 xz 必定 有 一 个 祖父 节点 gx， 并 且 是 黑色 的 ( 根 
据 特征 RB2 )。 当 pu 是 gu 的 左 孩 子 ，x 是 pu 的 左 孩子 且 gu 的 另 一 个 孩子 是 黑色 时 ( 这 另 一 
个 孩子 可 以 是 外 部 节点 )， 我 们 称 该 不 平衡 是 LLb 类 型 。 其 他 的 不 平衡 类 型 是 LLr (pu 是 gu 
的 左 孩 子 ,，u 是 pu 的 左 孩 子 ， 且 gu 的 另 一 个 孩子 是 红色 的 )，LRb (pu 是 gu 的 左 孩 子 , u 是 
pu 的 右 孩 子 且 gu 的 另 一 个 孩子 是 黑 的 )，LRr、RRb、RRr、RLb 和 RLr。 

XYr (X 和 YY 既 可 以 是 L， 也 可 以 是 R) 类 型 的 不 平衡 可 以 通过 改变 颜色 来 处 理 ， 而 
XYb 类 型 则 需要 旋转 。 当 节点 gu 被 改变 颜色 时 ， 它 和 上 一 层 的 节点 可 能 破坏 了 RB2 特性 。 
这 时 的 不 平衡 需要 重新 分 类 ， 而 且 x 变 为 gw， 然后 再 次 进行 转换 。 旋 转 结 束 后 ， 不 再 违反 
RB2 特性 ， 因 此 不 需要 再 进行 其 他 操作 。 

图 15-11 显示 的 是 LLr 和 LRr 型 不 平衡 的 颜色 变化 ， 这 些 变化 是 一 致 的 。 黑 色 节 点 用 阴 
影 表 示 ， 红 色 节 点 没有 阴影 。 例 如 ， 在 图 15-11a 中 ，gu 是 黑色 ， 而 pu 和 w 是 红色 。gu 的 两 
个 指针 是 红色 。gur 是 gu 的 右 子 树 ，pur 是 pu 的 右 子 树 。LLr 和 LRr 颜色 调整 需要 将 px 和 
gu 的 右 孩 子 由 红色 改 为 黑色 。 另 外 ， 如 果 gu 不 是 根 ， 还 要 将 gu 的 颜色 由 黑色 改 为 红色 。 如 
果 gu 是 根 节 点 ， 那 么 颜色 不 变 ， 这 时 ， 所 有 从 根 至 外 部 节点 路 径 上 的 黑色 节点 数量 都 增 1。 
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a) LLr 型 不 平衡 b) LLr 颜 色 改 变 之 后 c) LRr 型 不 平衡 ” . ”d) LRr 颜 色 改变 之 后 


图 15-11 LLr 和 LRr 类 型 的 颜色 变化 


如 果 将 gu 的 颜色 改 为 红色 而 引起 了 不 平衡 ,那么 gu 就 变 成 了 新 的 x 节点 ， 它 的 双亲 就 
变 成 了 新 的 pu， 它 的 祖父 节点 就 变 成 了 新 的 gx， 这 时 需要 继续 恢复 平衡 。 如 果 gu 是 根 节点 
或 者 gu 节点 的 颜色 改变 没有 违反 规则 RB2， 那 么 工作 就 完成 了 。 

图 15-12 是 处 理 LLb 和 LRb 不 平衡 时 所 做 的 旋转 。 在 图 15-12a 和 图 15-12b 中 ,pu 是 
pui 的 根 。 注 意 ， 这 些 旋转 与 AVL 树 的 插入 操作 所 需要 的 LL ( 见 图 15-4 ) 和 LR ( 见 图 15-5 
所 示 ) 旋转 有 相似 之 处 。 指 针 的 改变 是 相同 的 ， 例 如 ， 在 LLb 旋转 中 ， 不 仅 要 改变 指针 ， 还 
要 将 gu 的 颜色 由 黑色 改 为 红色 ， 将 pu 的 颜色 由 红色 改 为 黑色 。 

检查 图 15-12 在 旋转 之 后 的 节点 (或 指针 ) 颜色 ， 可 以 看 到 ， 在 所 有 从 根 至 外 部 节点 的 
路 径 上 ， 黑 色 节 点 〈 指 针 ) 的 数量 是 不 变 的 ， 进 一 步 说 ， 相 关子 树 的 根 ( 旋转 前 是 ex， 旋转 
后 是 pu 或 u) 在 旋转 后 是 黑色 的 ， 因此， 在 从 根 节点 至 新 pu 的 路 径 上 ， 不 存在 连续 两 个 红 
色 节 点 ,不 需要 再 作 平 衡 。 插 入 后 ,一 次 旋转 ( 在 旋转 之 前 可 能 有 O(logn) 次 的 颜色 改变 ) 足 
以 保持 平衡 。 
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图 15-12 红 - 黑 树 插入 操作 后 的 LLb 和 LRb 旋转 


例 15-1 考察 图 15-13a 的 红 - 黑 树 。 为 了 便于 理解 ， 我 们 给 出 了 外 部 节点 。 实 际 上 ， 
指向 外 部 节点 的 黑色 指针 只 是 空 指针 ， 外 部 节点 不 必 专 门 描述 。 注 意 ， 在 所 有 从 根 至 外 部 节 
点 的 路 径 上 都 有 三 个 黑色 节点 (包括 外 部 节点 ) 和 两 个 黑色 指针 。 





g) 插入 62 h) LRr 颜 色 改变 


图 15-13 红 - 黑 树 的 搬 人 
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i) RLb 旋 转 
图 15-13 ( 续 ) 


现在 用 程序 14-5 的 算法 ,将 70 插入 红 - 黑 树 中 ,成 为 80 的 左 孩 子 。 因 为 是 插入 一 棵 非 
空 的 树 ， 所 以 新 节点 被 赋予 红色 ， 指 向 它 的 指针 也 是 红色 。 这 次 插入 结果 没有 违反 RB2， 因 此 
不 需要 矫正 。 注 意 ， 在 从 根 至 外 部 节点 的 所 有 路 径 上 ， 黑 色 指 针 的 数量 在 插入 前 后 没有 变化 。 

接 下 来 把 60 插入 图 15-13b 的 红 - 黑 树 中 ， 作 为 70 的 左 孩子 ， 如 图 15-13c 所 示 。 新 节 
点 为 红色 ， 指 向 它 的 指针 也 为 红色 。 新 节点 (60 ) 是 x， 其 父 节 点 (70) 是 pu， 祖父 节点 
(80) 是 gx。 由 于 px 和 2 是 红色 ， 所 以 出 现 了 一 个 不 平衡 ， 而 且 是 LLr 型 不 平衡 (pu 是 gu 
的 左 孩 子 , x 是 pu 的 左 孩 子 ，gu 的 另 一 个 孩子 是 红色 )。 按 照 图 15-11a 和 图 15-11b 所 示 的 方 
法 改变 节点 颜色 ， 得 到 图 15-13d。 现 在 ， 节 点 uw、pu 和 gu 都 上 升 了 两 层 ， 节 点 80 变 为 新 的 
u， 根 节点 变 为 pu，gu 变 成 空 。 因 为 没有 gu 节点 ， 所 以 没有 出 现 破坏 RB2 的 情况 ,插入 完 
成 。 在 从 根 到 外 部 节点 的 所 有 路 径 上 ， 黑 色 指 针 数 量 都 是 2。 

现在 将 65 插入 图 15-13d 的 树 中 ， 结 果 如 图 15-13e 所 示 。 新 节点 (65 ) 是 yx， 它 的 父 节 
点 (60) 和 祖父 节点 (70 ) 分 别 是 px 和 gu。 这 里 产生 了 一 个 LRb 类 型 的 不 平衡 ， 需 要 执行 
图 15-12c 和 图 15-12d 所 示 的 旋转 ,结果 如 图 15-13f 所 示 。 

最 后 插入 62， 得 到 图 15-13g。 产 生 了 LRr 型 不 平衡 ， 需 要 改变 颜色 。 改 变 颜 色 后 ， 新 的 
u、pu 和 gu 节点 如 图 15-13h 所 示 。 颜 色 的 改变 引起 一 个 RLb 型 的 不 平衡 ， 必 须 执行 RLb 旋 
转 。 旋 转 结果 如 图 15-13i 所 示 。 到 此 完成 。 国 


15.2.5 红 - 黑 树 的 删除 


对 于 删除 操作 ， 首 先 使 用 普通 二 又 搜索 树 的 删除 算法 ( 程序 14-6 )， 然 后 进行 颜色 变动 ， 
如 果 需 要 的 话 ， 还 要 作 一 次 单 旋转 。 考 察 图 15-14a 的 红 - 黑 树 。 如 果 用 程序 14-6 来 删除 元 
素 70， 那 么 相应 的 节点 将 被 物理 性 删除 ， 得 到 图 15-14b 所 示 的 树 ( 如 果 使 用 了 指针 颜色 ， 那 
么 还 要 改变 90 的 左 指针 颜色 )。 如 果 从 图 15-14a 中 删除 元 素 90， 则 相应 的 节点 被 物理 性 删除 ， 
其 父 节点 65 的 右 孩 子 指针 指向 被 删除 节点 的 左 子 树 ， 得 到 图 15-14c。 从 图 15-14a 中 删除 元 素 
65 的 过 程 是 ， 把 元 素 62 移 到 根 节 点 ， 然 后 物理 性 删除 原 62 的 节点 ， 得 到 图 15-14d。 令 是 替 
代 被 删除 节点 的 节点 ， 如 图 15-14b 所 示 ，90 的 左 孩 子 被 删除 了 ， 它 新 的 左 孩子 是 外 部 节点 y。 

在 图 15-14b 中 ， 被 删除 节点 (在 图 15-14a 中 包含 70 的 节点 ) 是 红色 的 ， 删 除 它 不 会 影 
响 从 根 至 外 部 节点 的 路 径 上 黑色 节点 的 数量 ， 因 此 不 需要 作 任 何 恢复 平衡 的 工作 。 在 图 15- 
14c 中 ， 被 删除 节点 (在 图 15-14a 中 包含 90 的 节点 ) 是 黑色 ， 在 从 根 至 外 部 节点 的 路 径 
上 ， 黑 色 节 点 (和 指针 ) 的 数量 比 删除 前 少 了 一 个 。 由 于 y 不 是 新 的 根 ， 所 以 违反 了 RB3。 
在 图 15-14d 中 ， 被 删除 节点 是 红色 ， 因 此 不 违反 RB3。 仅 当 被 删除 节点 是 黑色 且 了 不 是 树 根 
的 时 候 ， 才 会 出 现 违反 RB3 的 情况 。 使 用 程序 14-6 执行 删除 操作 ， 不 可 能 出 现 违反 其 他 红 - 
黑 树 特 征 的 情况 。 
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项 
a) 一 棵 红 - 黑 树 b) 删除 70 





日 a 身 》 国 
c) 删除 90 d) 删除 65 


图 15-14 红 - 黑 树 的 删除 


当 违 反 RB3 的 情况 出 现时 ， 以 ?为 根 的 子 树 缺 少 一 个 黑色 节点 〈 或 一 个 黑色 指针 )， 因 
此 ， 从 根 至 > 子 树 的 外 部 节点 的 路 径 与 从 根 至 其 他 外 部 节点 的 路 径 相 比 ， 前 者 所 包含 的 黑色 
节点 数量 比 后 者 的 要 少 一 个 ， 这 时 的 树 是 不 平衡 的 。 不 平衡 的 类 型 可 以 根据 y 的 父 节点 py 和 
同胞 节点 v 的 特点 来 划分 。 当 y 是 py 的 右 孩 子 时 ， 不 平衡 是 型 的 ， 否则 是 工 型 的 。 通 过 观 
察 可 以 得 知 ， 如 果 》 缺少 一 个 黑色 节点 ， 那 么 "就 肯定 不 是 外 部 节点 。 如 果 v* 是 一 个 黑色 节 
点 ,那么 不 平衡 是 Lb 或 Rb 型 的 ; 而 当 v 是 红色 节点 时 ， 不 平衡 是 Lr 或 Rr 型 的 。 

首先 考察 Rb 型 的 不 平衡 。Lb 型 不 平衡 的 处 理 与 之 相似 。 根 据 v 的 红色 孩子 的 数量 , 把 Rb 
型 不 平衡 细 分 为 三 种 情况 : Rb0、Rbl 和 Rb2。 

当 不 平衡 类 型 是 Rb0 时 ， 需 要 颜色 改变 。 “只 PA ?内 
(如 图 15-15 所 示 )。 图 15-15 给 出 了 py 颜色 的 "人  ? 7 人 yy v9) >) 
两 种 可 能 改变 。 如 果 py 在 改变 前 是 黑色 的 ， 那 


VW VR Vv VR Vr VR 


么 颜色 的 改变 将 导致 以 py 为 根 的 子 树 缺少 一 个 a) Rb0 不 平衡 b) Rb0 颜 色 改 恋 
黑色 节点 。 在 图 15-15b 中 ， 从 根 至 v 的 外 部 节 
点 路 径 上 ， 黑 色 节点 数量 也 减少 了 一 个 。 因 此 ， 图 15-15 红 - 黑 树 删除 操作 的 Rb0 颜色 改变 
颜色 改变 后 ， 无 论 是 从 根 到 * 的 外 部 节点 的 路 径 ， 还 是 从 根 到 y 的 外 部 节点 的 路 径 ， 都 会 缺 
少 一 个 黑色 节点 。 如 果 py 是 整 棵 红 - 黑 树 的 根 ， 那 么 就 不 需要 再 做 其 他 工作 ， 否 则 ，zy 就 成 
新 的 y,，y 的 不 平衡 需要 重新 划分 ， 并且 在 新 的 y 点 需要 再 进行 调整 。 

若 改 变 颜色 前 py 是 红色 ， 则 从 根 到 y 的 外 部 节点 的 路 径 上 ， 黑 色 节 点 数量 增加 了 一 个 ， 
而 从 根 到 v 的 外 部 节点 的 路 径 上 ， 黑 色 节 点 数量 没有 改变 。 整 棵 树 达 到 平衡 。 

当 不 平衡 类 型 是 Rbl 和 Rb2 时 ， 需 要 进行 旋转 ， 如 图 15-16 所 示 。 在 图 中 ， 带 阴影 的 节 
点 既 可 能 是 红色 ， 也 可 能 是 黑色 。 这 种 节点 的 颜色 在 旋转 后 不 会 发 生变 化 。 因 此 ， 图 15-16b 
中 ， 子 树 的 根 在 旋转 前 和 旋转 后 ， 颜 色 保 持 不 变 一 一 图 15-16b 中 v 的 颜色 与 图 15-16a 中 py 
的 颜色 是 一 样 的。 可 以 证 明 ， 在 旋转 后 ， 从 根 至 y 的 外 部 节点 的 路 径 上 ， 黑 色 节 点 (黑色 指 
针 ) 数量 增加 一 个 ， 而 从 根 至 其 他 外 部 节点 路 径 上 ， 黑 色 节 点 的 数量 没有 变化 。 旋 转 使 树 恢 
复 了 平衡 。 
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py 
vy y VL py 
VW VR VR 了 
a) Rbl0) 型 不 平衡 b) Rbl0) 旋 转 之 后 c) Rb1(iD 型 不 平衡 
py 
w 
Vv » 
Vv Dy 
入 WwW 
VL wr We 了 
WL We 
e) Rb2 型 不 平衡 f) Rb2 旋 转 之 后 





d) Rb1(ii) 旋 转 之 后 


图 15-16 红 - 黑 树 删除 操作 的 Rbl 和 Rb2 型 旋转 


接 下 来 考察 Rr 型 的 不 平衡 。Lr 型 不 平衡 与 它 是 对 称 的 。 由 于 y 中 缺少 一 个 黑色 节点 并 


且 v 节 点 是 红色 ， 所 以 vi 和 va 都 至 少 有 一 个 黑色 » , 
节点 不 是 外 部 节点 ， 因 此 , v 的 孩子 都 是 内 部 节点 。 
根据 * 的 右 孩 子 中 红色 孩子 的 数量 (0，1 或 2 )， 及 
可 以 把 Rr 型 不 平衡 划分 为 三 种 情况 。 这 三 种 情况 


都 可 以 通过 一 次 旋转 来 获得 平衡 。 这 次 旋转 如 机 区 


a) Rr0 型 不 平衡 b) Rr0 旋 转 


图 15-17 和 图 15-18 所 示 。 你 可 以 再 一 次 验证 使 整 
棵 树 恢复 平衡 的 过 程 。 





a) Rr1(i) 型 不 平衡 c) Rrl(iD 型 不 平衡 





e) Rr2 型 不 平衡 f) Rr2 旋 转 之 后 
图 15-18 红 - 黑 树 删除 操作 的 Rrl 和 Rr2 旋转 


图 15-17 红 - 黑 树 删除 操作 的 Rr0 旋转 





d) Rrl(ii) 旋 转 之 后 
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例 15-2 如 果 从 图 15-13i 的 红 - 黑 树 中 删除 90， 就 得 到 图 15-19a 所 示 的 树 。 由 于 被 删 
除 节点 不 是 根 节 点 且 是 黑色 的 ， 因 此 产生 了 Rb0 型 不 平衡 。 颜 色 改 变 后 得 到 图 15-19b。 由 于 
py 原来 是 红色 的 ， 所 以 改变 颜色 后 使 树 重 新 恢复 了 平衡 。 





d) 删除 70 e) Rrl(i) 旋 转 之 后 
图 15-19 红 - 黑 树 的 删除 国 


如 果 现 在 从 图 15-19b 中 删除 80， 就 得 到 图 15-19c。 由 于 删除 的 是 红色 节点 ， 删 除 后 的 
树 仍 然 是 平衡 的 。 从 图 15-19c 中 删除 70， 得 到 图 15-19d， 这 次 删除 的 是 非 根 黑色 节点 ， 树 的 
平衡 被 破坏 了 。 不 平衡 类 型 是 Rr1(ii) 型 (v 的 右 孩 子 w 的 右 指针 是 红色 的 )。 执 行 Rrl(iD 型 
旋转 后 得 到 图 15-19e， 它 是 平衡 的 。 


15.2.6 ”实现 细节 的 考虑 及 复杂 性 分 析 


在 插入 或 删除 之 后 ， 为 了 恢复 红 - 黑 树 的 平衡 ,需要 回 到 根 节点 至 插入 或 删除 节点 的 路 
径 上 来 。 如 果 一 个 节点 除数 据 、 左 孩子 、 右 孩子 和 颜色 域外 ， 还 有 一 个 双亲 域 ， 那 么 这 种 回 
淹 很 容易 实现 。 增 加 双亲 域 的 一 个 替代 方案 是 : 在 从 根 节 点 至 搬入 或 删除 节点 路 径 上 ， 把 遇 
到 的 每 个 节点 的 指针 保存 到 一 个 栈 里 。 

通过 从 栈 中 删除 指针 ， 就 可 以 返 到 根 节点 。 对 于 一 个 n 元 素 的 红 - 黑 树 ， 增 加 双亲 域 使 
空间 需求 增加 了 @(n)， 而 栈 方法 使 空间 需求 增加 了 eB(logn)。 虽 然 栈 方法 在 空间 上 很 节省 , 但 
双亲 域 方 法 的 运行 速度 更 快 。 

在 插入 或 删除 之 后 ， 节 点 颜色 的 改变 是 沿 着 从 插入 或 删除 节点 到 根 的 方向 进行 的 ， 因 
此 时 间 为 O(logn)。 男 一 方面 ， 每 次 插入 / 删除 操作 之 后 ， 最 多 需要 一 次 旋转 ， 就 可 以 恢复 
树 的 平衡 。 每 次 颜色 改变 或 旋转 操作 需要 的 时 间 是 6(1)， 因 此 插入 / 删除 操作 需要 的 总 时 
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间 是 O(logn)。 
最 后 要 注意 的 是 ,在 C++ 的 STL 中 ， 实 现 字典 所 使 用 的 结构 是 红 - 黑 树 。 


练习 


23. 从 一 棵 空 的 红 - 黑 树 开始 ， 依 次 插入 关键 字 : 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5，, 
4，3，2，1。 模 仿 图 15-13 画图 ， 画 出 每 次 插入 之 后 和 旋转 或 颜色 改变 之 后 的 树 。 用 颜色 
标识 所 有 的 节点 ， 注 明 旋 转 的 类 型 。 

24. 以 下 列 一 组 关键 字 为 条 件 ， 重 做 练习 23 : 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 

13，14，15。 

. 以 下 列 一 组 关键 字 为 条 件 ， 重 做 练习 23 : 20，10，5，30，40，57，3，2，4，35，25， 

18, 22, 21s 

, 以 下 列 一 组 关键 字 为 条 件 ， 重 做 练习 23 : 40,，50, 70, 30, 42, 15, 20, 25,27，26, 

60，55。 

27. 一 棵 红 - 黑 树 初始 时 有 15 个 节点 ， 而 且 是 完全 二 又 树 ; 关键 字 是 1 ~ 15。 所 有 节点 都 是 
黑色 。 依 次 删除 关键 字 15，14，13，…，1。 每 一 次 删除 和 每 一 次 旋转 或 颜色 改变 之 后 ， 
画 出 相应 的 树 。 用 颜色 标识 所 有 的 节点 ， 注 明 旋转 的 类 型 。 


2 


(nm 


2 


a 


28. 重 做 练习 27， 前 提 是 删除 关键 字 的 顺序 为 1，2，3，…，15。 
29. 重 做 练习 27， 前 提 是 删除 关键 字 的 顺序 为 6，7，5，10，9，11，15，12，13，2。 
30. 重 做 练习 27， 前 提 是 删除 关键 字 的 顺序 为 11，14，13，15，9，12，2，3，1。 


31. 画 出 与 图 15-11 的 LLr 和 LRr 型 对 应 的 RRr 和 RLr 型 的 颜色 改变 。 

32. 画 出 与 图 15-12 的 LLb 和 LRb 型 对 应 的 RRb 和 RLb 型 的 旋转 。 

33. 画 出 与 图 15-15 的 Rb0 型 对 应 的 Lb0 型 的 颜色 改变 。 

34. 画 出 与 图 15-16 的 Rbl 和 Rb2 型 旋转 对 应 的 Lbl 和 Lb2 型 旋转 。 

35. 画 出 与 图 15-17 和 图 15-18 的 Rr0、Rrl 和 Rr2 型 旋转 相对 应 的 Lr0、Lrl 和 Lr2 型 的 旋转 。 

36. 设计 一 个 C++ 类 redBlackTree， 它 派生 于 抽象 类 bSTree ( 程序 14-1 )。 编 写 所 有 函数 的 代 
码 并 检验 其 正确 性 。 函 数 find、insert 和 delete 的 时 间 复 杂 性 必须 是 O(logmz)， 函 数 ascend 
的 时 间 复 杂 性 应 该 是 0(n)。 证 明 它 们 的 时 间 复 杂 性 。insert 和 delete 函数 的 实现 必须 采用 
本 节 的 方法 。 

37. 设计 一 个 C++ 类 dRedBlackTree， 它 派生 于 抽象 类 dBSTree ( 参看 练习 4 )。 编写 所 有 函数 
的 代码 并 检验 其 正确 性 。 函 数 find、insert 和 delete 必须 具有 复杂 性 O(logn)， 薄 数 ascend 
的 时 间 复 杂 性 应 该 是 O(n)。 证 明 它们 的 时 间 复 杂 性 。 

38. 设计 一 个 C++ 类 indexedRedBlackTree， 它 派生 于 抽象 类 indexedBSTree (程序 14-2 )。 编 
写 所 有 函数 的 代码 并 检验 其 正确 性 。 函 数 find、get、insert、erase 和 delete 的 时 间 复 杂 性 
必须 是 O(logn)， 卫 数 ascend 的 时 间 复 杂 性 应 该 是 O(n)。 证 明 它 们 的 时 间 复 杂 性 。 

39. 设计 一 个 C++ 类 dlIndexedRedBlackTree， 它 派生 于 抽象 类 dIndexedBSTree ( 见 练习 
5 )。 编 写 所 有 函数 的 代码 并 检验 其 正确 性 。 函 数 find、get、insert、delete 和 erase 的 
时 间 复 杂 性 必须 是 O(logn)， 函 数 ascend 的 时 间 复 杂 性 应 该 是 0(n)。 证 明 它 们 的 时 间 

40. 设计 一 个 C++ 类 linearListAsRedBlackTree， 它 派生 于 抽象 类 linearList。 编 写 所 有 函数 的 
代码 并 检验 其 正确 性 。 
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15.3 分裂 树 
15.3.1 介绍 


当 使 用 AVL 树 或 红 - 黑 树 来 实现 字典 时 ， 最 坏 情况 下 ， 每 一 个 字典 操作 的 时 间 复 杂 性 是 
字典 大 小 的 对 数 。 在 已 知 的 数据 结构 中 ,没有 一 个 会 提供 更 好 的 性 能 。 然 而 ， 在 字典 的 很 多 
实际 应 用 中 ， 令 我 们 更 感 兴趣 的 不 是 一 个 操作 而 是 一 个 操作 序列 所 需要 的 时 间 。 例 如 ， 在 第 
14 章 的 末尾 所 考虑 的 应 用 。 在 这 些 应 用 中 ， 每 一 个 应 用 的 时 间 复 杂 性 都 取决 于 一 个 字典 操作 
序列 ， 而 不 是 任意 一 个 操作 。 

分 裂 树 是 二 又 搜索 树 ， 而 且 对 一 个 单独 的 字典 操作 ， 其 时 间 复 杂 性 是 O(n)， 而 对 f 个 查 
找 find、i 个 插入 insert 和 4 个 删除 所 组 成 的 操作 序列 ， 其 时 间 复 杂 性 是 O(( 庆 i+q)logi)， 与 使 
用 AVL 树 或 红 - 黑 树 时 的 渐 近 时 间 复 杂 性 相同 。 实 验 研究 表明 ， 对 任意 的 字典 操作 序列 ， 分 
裂 树 比 AVL 树 和 红 - 黑 树 的 实际 运行 速度 要 快 。 不 仅 如 此 ， 分 裂 树 的 编码 还 更 容易 。 


15.3.2 ”分裂 树 的 操作 


用 分 裂 树 实施 字典 的 操作 与 类 binarySearchTree ( 见 14.3 节 ) 完全 相同 。 但 是 ， 按 照 分 
裂 树 操作 方法 ，get、put 和 remove 操作 是 从 分 裂 节 点 开始 的 。 在 分 裂 操 作 的 最 后 ， 分 裂 节 点 
是 二 又 搜索 树 的 根 。 分 裂 节点 (slay node ) 是 在 字典 操作 中 所 检查 的 最 深层 的 节点 ( 即 终止 
比较 关键 字 的 节点 、 生 成 的 节点 、 删 除 的 节点 ， 或 者 是 该 节点 的 左 孩子 或 右 孩 子 )。 

例 15-3 考虑 图 14-4a 的 二 又 搜索 树 。 当 实施 操作 find(80) 时 ， 检 查 最 深 的 节点 是 关键 
字 为 80 的 节点 ， 这 个 节点 是 分 裂 节 点 。 当 实施 操作 find(31) 时 ， 检 查 最 深 的 节点 是 关键 字 为 
31 的 节点 ， 这 个 节点 成 为 分 裂 节点 。 操 作 find(55) 的 搜索 路 径 是 从 30 到 60， 检 查 最 深 的 节 
点 是 关键 字 为 60 的 节点 ， 因 此 该 节点 成 为 分 裂 节点 。 

一 次 插 人 可 能 生成 一 个 新 节点 ， 或 覆盖 一 个 已 经 存在 的 节点 中 的 元 素 。 当 生成 一 个 新 节 
点 时 ， 这 个 新 节点 就 是 检查 最 深 的 节点 。 因 为 这 个 新 节点 成 为 分 裂 节 点 。 当 存在 的 一 个 元 素 
被 覆盖 时 ,包含 这 个 元 素 的 节点 便 是 被 检查 的 最 深 的 节点 。 于 是 这 个 节点 成 为 分 裂 节 点 。 在 
图 14-4a 中 ， 对 插入 操作 insert(5,e) 来 说 ， 分 裂 节 点 是 根 的 左 孩 子 。 对 插入 操作 insert(65,e) 来 
说 , 分裂 节 点 是 新 节点 ， 它 成 为 60 的 右 孩 子 。 

当 二 又 搜索 树 有 一 个 关键 字 为 的 元 素 时 ， 对 操作 delete( 而 言 ， 最 深 检 查 的 节点 是 要 删 
除 的 节点 。 这 个 节点 不 会 成 为 分 裂 节 点 ， 因 为 它 不 在 删除 后 的 树 中 。 被 删除 节点 的 父亲 节点 成 
为 分 裂 节 点 ， 因 为 它 是 在 检查 的 节点 中 所 留 下 的 最 深 的 节点 。 在 图 14-4a 中 ， 与 操作 delete(33) 
对 应 的 分 裂 节点 是 关键 字 为 32 的 节点 ， 与 操作 delete(35) 对 应 的 分 裂 节 点 是 关键 字 为 40 的 节 
点 ， 与 操作 delete(40) 对 应 的 分 裂 节 点 是 关键 字 为 32 的 节点 ， 与 delete(30) 对 应 的 分 裂 节点 是 
关键 字 为 5 的 节点 。 国 

分 裂 操作 由 一 个 分 裂 步骤 序列 所 构成 。 当 分 裂 节点 从 
是 二 又 搜索 树 的 根 时 ， 这 个 序列 为 空 。 当 分 裂 节点 不 是 z 1 
根 节点 时 ， 每 一 个 分 裂 步 又 都 将 分 裂 节 点 往 上 移动 一 层 2 
或 两 层 。 当 分 裂 节点 在 二 又 搜索 树 的 二 层 时 ， 移 动 一 层 。 

在 移动 一 层 的 分 裂 步 又 中 ， 有 两 种 类 型 。 一 种 是 
型 ， 分 裂 节点 9 是 其 父 节 点 的 左 孩 子 ; 男 一 种 是 RR 型 ， 阴影 节点 为 分 裂 节点 
分 裂 节 点 4 是 其 父 节 点 的 右 孩 子 。 图 15-20 显示 的 是 L 图 15-20 L 型 分 裂 步骤 


(~ 
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型 分 裂 步骤 。 注 意 ， 按 照 分 裂 步 又 ， 分 裂 节 点 成 为 二 叉 搜 索 树 的 根 。R 型 分 裂 步 又 与 之 类 似 。 

只 要 分 裂 节点 的 层 数 大 于 2， 就 要 实施 两 层 分 裂 步骤 。 这 时 ， 分 裂 节点 4 有 一 个 父 节点 p 
和 一 个 祖父 节点 gp。 两 层 分 裂 步 又 分 四 种 类 型 : LL、LR、RR 和 RL。 以 LR 分 裂 步骤 为 例 : 
万 是 gp 的 左 孩 子 , 9 是 的 右 孩 子 。 图 15-21 显示 的 是 LL 型 和 LR 型 分 裂 步骤。 在 每 一 种 分 
裂 步骤 中 ， 分 裂 节 点 都 向 上 移动 两 屋 。RR 型 和 LR 型 分 裂 步骤 类 似 。 注 意 ， 分 裂 步 又 与 AVL 
树 旋 转 (图 15-4 和 图 15-5 ) 的 相似 性 。 





a) LL 型 b) LR 型 
a、b、c 和 a 为 子 树 
阴影 节点 为 分 裂 节点 


图 15-21 LL 型 和 LR 型 分 裂 步骤 


例 15-4 考虑 图 15-22a 所 示 的 二 又 搜索 树 。 假 设 实施 操作 find(2)。 带 阴影 的 节点 成 为 
分 裂 节点 ， 分 裂 步骤 从 此 开始 。 这 个 分 裂 步骤 首先 用 LL 型 分 裂 步骤 把 分 裂 节 点 从 第 6 层 上 移 
到 第 4 层 ( 见 图 15-22b ) ; 接 下 来 ，LR 型 分 裂 步 又 把 分 裂 节 点 上 移 到 第 2 层 ( 见 图 15-22c ) ; 
最 后 ，L 型 分 裂 步骤 把 分 裂 节点 上 移 到 第 1 层 。 





c) LR 型 分 裂 步骤 之 后 d) 工 型 分 裂 步 骤 之 后 


a~ 8 为 子 树 
阴影 节点 为 分 裂 节点 


15-22 分裂 操作 示例 国 
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其 实 ， 仅 仅 使 用 一 层 分 裂 步骤 ( 即 工 型 和 及 型 ) 也 可 以 把 分 裂 节点 从 二 又 搜索 树 的 任 
意 层 上 移 到 第 一 层 ， 但 是 这 样 做 不 能 保证 任 一 个 由 J 个 查找 、i 个 插入 和 4 个 删除 所 组 成 的 操 
作 序 列 可 以 用 O(UAi+d)logD 时 间 来 完成 。 为 保证 这 个 时 间 ， 需 要 两 层 分 裂 步骤 组 成 的 序列 ， 
至 多 在 最 后 加 上 一 个 一 层 分 裂 步 又 。 


15.3.3 ”折算 复杂 性 


一 个 操作 的 实际 时 间 复 杂 性 和 最 坏 情 况 的 时 间 复 杂 性 与 操作 的 执行 步 数 密切 相关 。 但 是 

一 个 操作 的 折算 复杂 性 ( amortized Complexity ) 常常 与 实际 复杂 性 没有 直接 关系 ， 它 是 一 种 

计算 技法 。 它 唯一 的 要 求 是 ， 对 一 个 操作 序列 ， 所 有 操作 的 折算 复杂 性 之 和 大 于 或 等 于 实际 
复杂 性 之 和 。 即 

Yamortized (i) > > actual (i) (415-1) 


其 中 ，amortized(i) 和 actual(i)， 分 别 表示 在 含有 个 操作 的 序列 中 ， 第 i 个 操作 的 折算 和 实际 
复杂 性 。 因 此 我 们 可 以 把 折算 复杂 性 当 作 任 意 操作 序列 的 时 间 复 杂 型 的 上 限 。 

你 可 以 把 一 个 操作 的 折算 复杂 性 看 做 是 你 要 求 的 运行 时 间 ， 而 不 是 实际 的 运行 时 间 。 只 
要 这 个 运行 时 间 至 少 等 于 操作 序列 实际 运行 时 间 。 

定理 15-1 在 一 棵 具有 nn 个 元 素 的 分 裂 树 中 ， 查 找 、 插 入 或 删除 操作 的 折算 复杂 性 是 
O(logn), 

根据 定理 15-1 和 公式 (15-1 )， 由 了 次 查找 、i 次 插入 和 4 次 删除 所 构成 的 操作 序列 ， 其 
实际 的 时 间 复 杂 性 为 O((f+itd)logi)。 


练习 


41. 一 棵 分 裂 树 具 有 15 个 节点 ， 而 且 是 完全 二 又 树 ， 其 关键 字 是 1 ~ 15。 按 给 定 顺 序 查 找 关 
键 字 15，14，13，…，1。 夯 出 每 一 次 旋转 以 后 的 图 ， 并 标识 旋转 类 型 。 
42. 重 做 练习 41， 不 过 查找 关键 字 的 次 序 为 1,，15, 8, 7, 12, 10, 6, 2, 14。 
43. 从 一 棵 空 的 分 裂 树 开始 ， 按 给 定 顺 序 插入 关键 字 : 20，10，5，30，40，25，8，35，7， 
23。 模 仿 图 15-20 至 图 15-22 画图 ， 每 次 插入 和 旋转 之 后 画图 。 标 识 出 每 次 旋转 的 类 型 。 
44. 重 做 练习 43， 不 过 插入 的 关键 字 序 列 为 : 40，50，70，30,， 35，75，25，10，15，22， 
16, 23。 

45. 一 棵 分 裂 树 具有 15 个 节点 ， 且 是 完全 二 又 树 ， 其 关键 字 是 1 ~ 15。 按 给 定 顺序 删除 关键 
字 15$，14，13，…，1。 画 出 每 一 个 删除 和 旋转 之 后 的 图 。 标 识 出 每 一 次 旋转 的 类 型 。 

46. 重 做 练习 45， 不 过 删除 的 关键 字 顺 序 为 1，2，3，…，15。 

47. 重 做 练习 45， 不 过 删除 的 关键 字 顺 序 为 6，7，5，10，9，11，15，12，13，14。 

48. 重 做 练习 45， 不 过 删除 的 关键 字 顺 序 为 11, 14, 13, 15, 9，12，2，3，1。 

49. 1 ) 与 图 15-20 和 图 15-21 类 似 ， 夯 出 R 型 、RR 型 和 RL 型 分 裂 步骤。 
2 ) 根据 图 15-22 画图 ， 从 一 棵 二 又 搜索 树 开 始 ， 在 分 裂 节 点 上 实施 RR、RL 和 R 型 分 裂 

步 双 ， 同 时 把 分 裂 节 点 上 移 到 第 1 层 。 

50. 给 出 一 棵 具有 nn 个 节点 且 高 度 为 n 的 分 裂 树 。 由 此 得 知 ， 操 作 find、insert 和 delete 的 时 
间 复 杂 性 是 O(n)。 

51. 为 什么 一 个 分 裂 操作 可 以 用 来 实现 练习 12 的 分 裂 方法 。 
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52. 设计 类 splayTree， 它 用 分 裂 树 实现 抽象 类 bsTree 的 所 有 方法 。 测 试 你 的 代码 的 正确 性 。 

53. 设计 类 dSplayTree， 它 用 分 裂 树 实现 抽象 类 dBSTree ( 见 练习 4 ) 的 所 有 方法 。 测试 你 的 
代码 的 正确 性 。 

54. 设计 类 indexedSplayTree， 它 用 分 裂 树 实现 抽象 类 indexedBSTree 的 所 有 方法 。 测 试 你 的 
代码 的 正确 性 。 

55. 设计 类 dIndexedSplayTree， 它 用 分 裂 树 实现 抽象 类 dmdexedBSTree ( 见 练习 5) 的 所 有 方 
法 。 测 试 你 的 代码 的 正确 性 。 

56. 设计 类 linearListAsSplayTree， 它 用 分 裂 树 实现 抽象 类 linearList。 测 试 你 的 代码 的 正确 性 。 


15.4 ”B- 树 
15.4.1 ”索引 顺序 访问 方法 


当 字 典 足 够 小 ， 可 以 整个 驻 留 在 内 存 中 时 ，AVL 树 和 红 - 黑 树 都 能 够 保证 良好 的 时 间 
性 能 。 对 于 那些 必须 存储 在 磁盘 上 的 大 型 字典 ( 外 部 字典 或 文件 )， 需 要 度数 更 高 的 搜索 树 
来 改善 字典 操作 的 性 能 。 在 研究 这 样 的 搜索 树 之 前 ， 先 看 一 下 外 部 字典 的 索引 顺序 访问 方法 
( indexed sequential access method, ISAM )。 这 种 方法 对 顺序 和 随机 访问 都 具有 良好 的 时 间 性 能 。 

在 ISAM 方法 中 ， 可 用 的 磁盘 空间 被 划分 为 很 多 块 。 块 是 在 磁盘 空间 中 用 来 输入 或 输出 

的 最 小 单位 。 块 一 般 具 有 和 磁道 一 样 的 长 度 ， 而 且 可 以 在 一 次 搜索 和 延迟 中 完成 输入 或 输出 。 
字典 元 素 以 升序 存储 在 块 中 。 而 且 这 些 块 按照 一 种 顺序 来 组 织 ， 使 得 从 一 块 到 男 一 块 的 延 时 
最 短 。 

在 顺序 访问 时 ， 块 按 序 输入 ， 每 一 个 块 中 的 元 素 按 升序 搜索 。 如 果 每 个 块 包含 个 元 
素 ， 则 搜索 每 个 元 素 所 需要 的 磁盘 访问 次 数 为 1/m。 

要 支持 随机 访问 ， 就 要 维持 一 个 索引 。 索 引 包 括 每 个 块 的 最 大 关键 字 。 这 样 一 来 ， 索 引 
中 的 关键 字数 量 与 块 的 数量 相同 ， 并 且 每 个 块 都 能 储存 很 多 元 素 ( 即 m 值 通常 较 大 )， 因 此 
索引 足以 整个 驻 留 在 内 存 中 。 为 了 随机 访问 关键 字 为 大 的 元 素 ， 首 先 要 查找 索引 表 ， 确 定 该 
元 素 所 属 的 块 ， 然 后 把 相应 的 块 从 磁盘 中 取出 进行 内 部 搜索 ， 以 确定 该 元 素 。 结 果 ， 一 次 磁 
盘 访 问 就 足以 完成 一 次 随机 访问 。 

这 种 技术 可 以 扩充 到 更 大 的 字典 , 这 种 字典 存储 在 若干 个 磁盘 。 这 时 的 元 素 按 升 序 被 分 
配 到 不 同 的 磁盘 中 ， 在 一 个 磁盘 中 的 元 素 又 按 升序 被 分 配 到 不 同 块 中 。 每 个 磁盘 都 有 一 个 块 
索引 ， 它 保存 着 在 该 磁盘 中 每 个 块 的 最 大 关键 字 。 另 外 ， 还 有 一 个 磁盘 索引 ， 它 保存 着 每 个 
磁盘 的 最 大 关键 字 。 磁 盘 索 引 一 般 驻 留 在 内 存 中 。 

为 了 随机 访问 一 个 元 素 ， 首 先 要 搜索 驻 留 在 内 存 中 的 磁盘 索引 ， 以 确定 该 元 素 所属 的 磁 
盘 ; 然后 从 该 磁盘 中 取出 块 索引 进行 搜索 ， 以 确定 该 元 素 所 属 的 块 ; 最 后 从 磁盘 中 取出 块 进 
行内 部 搜索 ， 以 确定 该 元 素 。 这 样 一 来 ， 一 次 随机 访问 需要 两 次 磁盘 访问 (一 次 是 取出 块 索 
引 ， 男 一 次 是 取出 块 )。 

ISAM 方法 本 质 上 是 一 种 数组 描述 方法 ， 因 此 ， 当 执行 插入 和 删除 时 ， 会 面临 很 大 问题 。 
为 了 部 分 地 缓解 问题 的 压力 ， 可 以 在 每 个 块 中 预 留 一 些 空间 ， 使 得 在 插入 少量 元 素 时 ， 不 需 
要 在 块 与 块 之 间 移 动 元 素 。 类 似 的 ， 在 执行 删除 操作 之 后 ， 可 以 把 闲置 的 空间 保留 下 来 ， 不 
必 为 了 节省 空间 而 在 块 与 块 之 间 移 动 元 素 。 

使 用 ISAM 方法 可 以 解决 这 些 难 题 ， 但 是 顺序 访问 的 代价 提高 了 。 以 任意 顺序 存储 的 元 
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素 ， 每 一 个 关键 字 的 索引 都 要 检查 ， 所 有 元 素 都 通过 这 个 索引 来 访问 。 对 存储 在 磁盘 上 的 数 
据 ，B- 树 是 一 种 适合 于 索引 方法 的 数据 结构 。 


15.4.2 mm 又 搜 索 树 


定义 15-2 m 叉 搜索 树 (m-way search tree ) 可 以 是 一 棵 空 树 。 如 果 非 空 ， 它 必须 满足 
以 下 特征 : 

1 ) 在 相应 的 扩充 搜索 树 中 ( 即 用 外 部 节点 蔡 换 空 指针 之 后 所 得 到 的 搜索 树 )， 每 个 内 部 
节点 最 多 可 以 有 m 个 孩子 以 及 1 ~ m-l1 个 元 素 ( 外 部 节点 不 含 元 素 和 孩子 )。 

2 ) 每 一 个 含有 p 个 元 素 的 节点 都 有 p+l1 个 孩子 。 

3 ) 对 任意 一 个 含有 个 元 素 的 节点 ， 设 kK，…，k, 分 别 是 这 些 元 素 的 关键 字 。 这 些 元 素 
顺序 排列 ， 即 ki<k2<…<kp。 设 co, C1,，"…， Cp 是 该 节点 的 p+l1 个 孩子 。 在 以 co 为 根 的 子 树 中 ， 
元 素 的 关键 字 小 于 ki; 在 以 Cp 为 根 的 子 树 中 ， 元 素 的 关键 字 大 于 ,; 在 以 ci 为 根 的 子 树 中 ， 
元 素 的 关键 字 大 于 此 而 小 于 ki,'1， 其 中 1 < i<p。 

在 定义 m 叉 搜索 树 时 ， 把 外 部 节点 包括 进来 是 有 用 的 ， 不 过 在 实际 的 代码 中 ， 不 需要 专 
门 描述 外 部 节点 ， 只 要 用 空 指针 来 表示 它 就 可 以 了 。 

图 15-23 是 一 棵 七 又 搜索 树 ， 其 中 黑色 方块 代表 外 部 节点 ， 其 他 都 是 内 部 节点 。 根 节点 
包含 两 个 元 素 ( 关键 字 是 10 和 80 ) 和 三 个 孩子 ， 中 间 的 孩子 有 6 个 元 素 和 7 个 孩子 ,这 7 
个 孩子 中 有 6 个 孩子 是 外 部 节点 。 





图 15-23 ”七 又 搜索 树 


1.m 又 搜索 树 的 搜索 

在 图 15-23 的 七 叉 搜 索 树 中 ， 要 查找 关键 字 为 31 的 元 素 ， 先 从 根 节 点 开始 。31 位 于 10 
和 80 之 间 ， 沿 中 间 的 指针 往 下 找 。( 根据 定义 ， 在 第 一 棵 子 树 中 所 有 元 素 的 关键 字 <10， 在 第 
三 棵 子 树 中 ， 所 有 元 素 的 关键 字 >80 )。 搜 索 中 间 子 树 的 根 。 因 为 k2<31<ks3， 所 以 要 移动 到 该 
节点 的 第 三 棵 子 树 中 。 这 时 31<k1， 因 此 要 继续 移动 到 第 一 棵 子 树 中 。 这 次 的 移动 使 我 们 从 树 
中 “ 掉 ” 了 下 来 ， 即 到 达 了 外 部 节点 。 由 此 得 知 ， 在 搜索 树 中 ， 不 包含 关键 字 为 31 的 元 素 。 

2.m 又 搜索 树 的 插入 

如 果 要 插入 关键 字 为 31 的 元 素 ， 则 先 要 按 以 上 步骤 查找 该 元 素 ， 然 后 在 节点 [32,36] 处 
查找 失败 。 由 于 该 节点 可 以 容纳 6 个 元 素 (七 又 树 搜 索 树 的 每 个 节点 最 多 可 以 容纳 6 个 元 
素 )， 所 以 新 元 素 被 插入 该 节点 的 第 一 个 位 置 。 

如 果 要 插入 关键 字 为 65 的 元 素 ， 则 先 查 找 该 元 素 ， 然 后 在 节点 [20,30,40,50,60,70] 
处 查找 失败 。 因 为 该 节点 已 满 ， 所 以 必须 生成 一 个 新 节点 来 容纳 该 元 素 ， 而 且 成 为 节点 
[20,30,40,50,60,70] 的 第 六 个 孩子 。 

3.m 又 搜索 树 的 删除 

要 在 图 15-23 中 删除 关键 字 为 20 的 元 素 ， 首 先 要 查找 该 元 素 ， 它 在 根 节点 的 中 间 孩 子 中 
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是 第 一 个 元 素 。 因 为 有 =20 并 且 co=c1=0， 所 以 该 元 素 可 以 直接 从 节点 中 删除 。 这 时 的 节点 变 
成 [30,40,50,60,70]。 类 似 的 ， 如 果 要 删除 关键 字 为 84 的 元 素 ， 首 先 确 定 该 元 素 的 位 置 ， 它 在 
根 节点 的 第 三 个 孩子 中 是 第 二 个 元 素 。 因 为 ci=cz=0， 所 以 该 元 素 可 以 直接 从 节点 中 删除 ， 这 
时 的 节点 变 为 [82,86,88]。 

删除 关键 字 为 5 的 元 素 要 复杂 一 点 ， 因 为 不 仅 该 元 素 是 节点 的 第 一 个 元 素 ， 而 且 与 它 相 
邻 子女 (这 里 指 的 是 co 和 ci ) 至 少 有 1 个 是 非 空 的 。 这 时 需要 用 相 邻 的 非 空 子 树 〈 例 如 co ) 
中 关键 字 最 大 的 元 素 ( 即 关键 字 为 4 的 元 素 ) 来 替换 被 删除 的 元 素 。 

要 在 根 节点 中 删除 关键 字 为 10 的 元 素 ， 既 可 以 用 co 中 的 最 大 元 素 ， 也 可 以 用 c, 中 的 最 
小 元 素来 替换 。 如 果 用 co 中 的 最 大 元 素来 替换 ， 那 么 将 关键 字 为 5 的 元 素 移 上 来 之 后 ， 还 要 
做 一 次 替换 ， 用 关键 字 为 4 的 元 素 占 据 它 原来 的 位 置 。 

4.m 又 搜索 树 的 高 

一 棵 高 度 为 疡 的 六 又 搜索 树 (不 含 外 部 节点 ) 最 少 有 大 个 元 素 (每 层 一 个 节点 ， 每 个 节 
点 包含 一 个 元 素 )， 最 多 有 m*-1 个 元 素 。 上 限 是 这 样 计 算 的 : 从 1 到 h-1 层 ,每 个 节点 都 售 


有 六 个 孩子 ， 第 刀 层 的 节点 没有 孩子 ， 这 时 的 节点 个 数 为 部 邓 = Co - D/(m - D) ， 而 每 个 节 
点 最 多 有 m-1 元 素 ， 因 此 元 素 个 数 为 m1。 ~ 


因为 在 高 度 为 h 的 m 叉 搜索 树 中 ， 元 素 个 数 在 hh 到 m4-1 之 间 ， 所 以 一 棵 nn 元 素 的 m 叉 
搜索 树 的 高 度 在 logm(n+1) 到 之 间 。 

例如 ， 一 棵 高 度 为 5 的 200 又 搜索 树 能 够 容纳 的 元 素 最 多 是 32*10"-1， 最 少 是 5。 同 
样 ， 一 棵 含有 32*10"-1 个 元 素 的 200 又 搜索 树 ， 其 高 度 在 5 到 32*10"-1 之 间 。 当 搜索 树 储 
存在 磁盘 上 时 ， 搜 索 、 插 人 和 删除 的 时 间 取 决 于 磁盘 的 访问 次 数 ( 假设 每 一 个 节点 的 大 小 不 
大 于 一 个 磁盘 块 )。 当 有 是 树 的 高 度 时 ， 这 个 次 数 为 O0(h)， 因 此 ， 要 减少 磁盘 访问 次 数 ， 就 要 
确保 树 的 高 度 接近 于 logn(n+1)， 为 此 就 要 利用 m 又 平衡 搜索 树 。 


15.4.3 m 阶 B- 树 


定义 15-3 m 阶 B- 树 (B-Tree of order m ) 是 一 哥 m 又 搜索 树 。 如 果 B- 树 非 空 ， 那 么 
相应 的 扩展 树 满足 下 列 特征 : 

1 ) 根 节 点 至 少 有 2 个 孩子 。 

2 ) 除根 节点 以 外 ， 所 有 内 部 节点 至 少 有 [im/2| 个 孩子 。 

3 ) 所 有 外 部 节点 在 同一 层 。 

图 15-23 的 七 又 搜索 树 不 是 一 棵 七 阶 B- 树 ， 因 为 它 的 外 部 节点 不 在 同一 层 。 其 实 不 仅 如 
此 ， 非 根 内 部 节点 [5] 和 [32,36] 分 别 有 2 个 孩子 和 3 个 孩子 ， 而 七 阶 B- 树 的 非 根 内 部 节点 应 
该 至 少 有 [7/2]1= 4 个 孩子 。 图 15-24 的 七 又 
搜索 树 是 七 阶 B- 树 ， 因 为 外 部 节点 均 在 第 
3 层 ， 根 节点 有 3 个 孩子 ， 且 其 余 内 部 节 [141 
点 至 少 有 4 个 孩子 。 向 自由 汪 2 

在 二 阶 B- 树 中 ， 每 个 内 部 节点 都 不 会 图 15-24 七 阶 B- 树 
有 2 个 以 上 的 孩子 ， 而 每 个 内 部 节点 又 至 
少 有 2 个 孩子 ， 因 此 二 阶 B- 树 的 所 有 内 部 节点 都 恰好 有 2 个 孩子 。 又 因为 所 有 外 部 节点 都 在 
同一 层 上 ， 所 以 二 阶 B- 树 是 满 二 又 树 。 因 此 ， 对 某 个 整数 h， 仅 当 元 素 个 数 为 2-1 时 ， 这 样 
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的 树 才 存在 。 

一 棵 三 阶 B- 树 ， 因 为 其 内 部 节点 必须 有 2 个 孩子 或 3 个 孩子 ， 所 以 也 称 2-3 树 。 一 棵 四 
阶 B- 树 ， 因 为 其 内 部 节点 必须 有 2 
个 、3 个 或 4 个 孩子 ， 所 以 叫做 2-3-4 
树 (或 简称 2，4 树 )。 图 15-25 是 一 棵 
2-3 树 。 不 过 ， 要 把 关键 字 为 14 和 16 
的 元 素 加 入 20 的 左 孩 子 中 ， 这 棵 树 就 
成 为 2-3-4 树 了 。 


15.4.4 ”B- 树 的 高 度 


定理 15-3 设 T 是 一 棵 高 度 为 h 的 m 阶 B- 树 。 令 q=[m/2|， 7 是 了 的 元 素 个 数 ， 则 
1) 2d™'-1<ngm-1 





图 15-25 ”2-3 树 或 三 阶 B- 树 





2) log.O+D<A<log(23L)+1 

证 明 nn 的 上 限 源 于 7 是 一 棵 m 叉 搜索 树 这 个 事实 。 对 于 n 的 下 限 ， 注 意 在 相应 2 
展 B- 树 中 ， 外 部 节点 都 在 Ar+1 层 , 而 1，2，3，4，…，H+1 层 的 节点 最 少 个 数 分 别 是 1， 
2d, 24，…，24”"， 因 此 ， 外 部 节点 的 最 少 个 数 是 24d” i 因为 外 部 节 ae 1 ， 
所 以 

n 之 2d”'!'— 

从 1) 可 直接 得 到 2 )。 图 

由 定理 15-3 可 知 ， 一 棵 高 度 为 3 的 200 阶 B- 树 至 少 有 19 999 个 元 素 ， 而 高 度 为 5 的 
200 阶 B- 树 至 少 有 2*10:-1 个 元 素 。 因 此 ， 如 果 使 用 200 阶 或 更 高 阶 B- 树 ， 即 使 元 素数 量 再 
多 ， 树 的 高 度 也 可 以 很 小 。 实 际 上 ，B- 树 的 阶 取 决 于 磁盘 块 的 大 小 和 元 素 的 大 小 。 节 点 的 元 
素 个 数 少 于 磁盘 块 的 元 素 个 数 并 无 好 处 ， 这 是 因为 每 次 磁盘 访问 都 是 读 或 写 一 个 块 。 而 节点 
大 于 磁盘 块 也 不 可 取 ， 因 为 这 会 带 来 多 重 磁盘 访问 ， 而 每 次 磁盘 访问 都 伴随 一 次 搜索 和 时 间 
延迟 。 

虽然 在 实际 应 用 中 ，B- 树 的 阶 很 大 ， 但 在 我 们 的 例子 中 ，m 值 都 很 小 ， 这 是 因为 当 m 的 值 
为 200， 4 为 100 时 ,一 棵 两 层 的 200 阶 B- 树 至 少 有 199 个 元 素 (一 棵 两 层 的 m 阶 B- 树 至 少 
有 2cd-1 个 元 素 )， 处 理 这 样 一 棵 多 元 素 的 树 是 很 麻烦 的 。 我 们 的 实例 包含 2-3 树 和 7 阶 B 树 。 


15.4.5”B- 树 的 搜索 


B- 树 的 搜索 算法 与 m 又 搜索 树 的 搜索 算法 相同 。 在 搜索 过 程 中 ， 从 根 至 外 部 节点 路 径 上 
的 所 有 内 部 节点 都 有 可 能 被 搜索 到 ， 因 此 ， 磁 盘 访问 次 数 最 多 是 有 (hh 是 B- 树 的 高 度 )。 


15.4.6”B- 树 的 插入 


要 在 B- 树 中 插入 一 个 新 元 素 ， 首 先 要 在 B- 树 中 搜索 关键 字 与 之 相同 的 元 素 。 如 果 存 在 
这 样 的 元 素 ， 那 么 插入 失败 ， 因 为 在 B- 树 的 元 素 中 不 允许 有 重复 的 关键 字 。 如 果 不 存在 这 样 
的 元 素 ,， 便 可 以 将 元 素 插 入 在 搜索 路 径 中 所 遇 到 的 最 后 一 个 内 部 节点 中 。 例 如 ， 将 关键 字 为 
3 的 元 素 插 入 图 15-24 的 B- 树 ， 首 先 检 查 根 节点 及 其 左 孩 子 ， 然 后 在 左 孩子 的 第 二 个 外 部 节 
点 处 查找 失败 。 这 个 左 孩 子 目前 具有 3 个 元 素 ， 而 实际 上 可 以 容纳 6 个 元 素 ， 因 此 新 元 素 可 
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以 直接 插入 这 个 节点 中 。 结 果 如 图 15-26a 所 示 。 对 根 节 点 及 左 孩 子 有 两 次 磁盘 读 操 作 ， 对 左 
孩子 另 有 一 次 磁盘 写 操作 。 





























c) 将 44 插 入 图 15-25 
图 15-26 ”B- 树 的 插入 


下 面 将 关键 字 为 25 的 元 素 插 入 图 15-26a 的 B- 树 中 。 插 和 位置 是 节点 [20,30,40,50,60,70] 
中 ,但 是 该 节点 已 经 饱和 了 。 当 在 一 个 饱和 节点 中 插入 一 个 新 元 素 时 ， 需 要 分 裂 该 节点 。 令 
P 是 饱和 节点 ,现在 将 带 有 空 指针 的 新 元 素 e 插 入 P， 得 到 一 个 有 m 个 元 素 和 m+l 个 孩子 的 
溢出 节点 。 我 们 用 下 面 的 序列 来 表示 这 个 溢出 节点 : 
Wm Co». ee ™, (Embm) 
其 中 e; 是 元 素 ，c; 是 孩子 指针 。 该 节点 从 元 素 es 处 分 裂 ， 其 中 4=[m/21。 左 边 的 元 素 保 留 在 
PP 中， 右边 的 元 素 移 到 新 节点 OQ 中 。 数 对 (es，Q ) 被 插入 书 的 父 节 点 ， 新 节点 已 和 2 的 格 
式 为 : 
P: qd-1, co, (e1,c1), ***, (eq_1,cd-1) 
Q: m-d, ca, (edrlsCd+rl), ***, (emCm) 
注意 ，P 和 0 的 孩子 个 数 至 少 是 d。 
在 本 例 中 ， 溢 出 节点 是 
7, 0, (20,0 ), (25,0), (30,0), (40,0), (50,0), (60,0), (70,0) 
且 d=4。 在 es 处 分 开 后 的 两 个 节点 分 别 是 : 
P: 3, 0, (20,0), (25,0), (30,0) 
Q:3, 0, (50,0), (60,0), (70,0) 
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当 把 (40，0Q ) 插入 己 的 父 节 点 中 时 ， 得 到 图 15-26b。 
为 了 将 25 插入 图 15-26a， 需 要 从 磁盘 中 读 取 根 节 点 及 其 中 间 孩 子 ， 然 后 将 分 开 的 两 个 节 
点 和 修改 后 的 根 节点 写 回 到 磁盘 中 。 磁 盘 访问 次 数 一 共 是 5 次 。 
考察 最 后 一 个 例子 ， 将 关键 字 为 44 的 元 素 插 入 图 15-25 的 2-3 树 中 。 插 入 位 置 是 节点 
[3$,40]。 因 为 该 节点 是 饱和 节点 ， 所 以 搬入 后 得 到 溢出 节点 : 
3, 0, (35,0), (40,0), (44,0) 
从 ere: 处 分 开 得 到 2 个 节点 : 
P: 1, 0, (35,0) 
QO: 1, 0, (44,0) 
把 数 对 (40,0 ) 插入 P 的 父 节 点 时 ， 发 现 该 节点 也 是 饱和 的 。 令 该 节点 是 4， 插入 后 是 一 个 
溢出 节点 : 
A:3, P, (40,0)，(50,C)，(60.D ) 
其 中 C 和 DD 是 指向 节点 [55] 和 [70] 的 指针 。 滋 出 节点 4 被 分 开 后 ， 产 生 节点 B。 新 节点 4 
和 B 如 下 : 
A:1, P, (40,0) 
B:1, C, (60.D) 
现在 要 将 (50,8B ) 插入 根 节点 。 在 插入 前 ， 根 节点 的 结构 是 : 
R:2, S, (30,4), (80,7) 
其 中 S$ 和 了 是 分 别 指向 根 节点 第 一 和 第 三 棵 子 树 的 指针 。 插 入 (50,8 ) 之 后 ， 得 到 溢出 节点 : 
R:3, S, (30,4), (50,B8), (80,7) 
将 此 节点 从 关键 字 为 50 的 元 素 处 分 开 ， 产 生 新 节点 丸和 U， 如 下 所 示 : 
R:1, S$, (30,4) 
U:1, B, (80,7) 
(50,U) 一 般 插入 R 的 父 节点 ,但 是 没有 父 节 点 。 因 此 ， 产 生 一 个 新 的 根 节点 如 下 : 
1, R, (50,U) 
得 到 图 15-26c 所 示 的 2-3 树 。 
读 取 节点 [30,80]、[50,60] 和 [35.40]， 需 要 三 次 访问 磁盘 。 每 次 节点 分 裂 之 后 ， 要 将 修改 
的 节点 和 新 节点 写 回 磁盘 ， 需 要 两 次 访问 磁盘 。 因 为 有 3 个 节点 被 分 裂 ， 所 以 执行 了 6 次 磁 
盘 写 操作 。 最 后 产生 一 个 新 的 根 节点 并 写 回 磁盘 ， 又 需要 用 1 次 额外 的 磁盘 访问 。 因 为 磁盘 
访问 的 总 次 数 为 10。 
当 插 入 操作 引起 了 s 个 节点 分 裂 时 ,磁盘 访问 的 次 数 为 h ( 读 取 搜索 路 径 上 的 节点 ) +28 
( 回 写 分 裂 出 的 两 个 新 节点 ) +1 ( 回 写 新 的 根 节点 或 插入 后 没有 导致 分 裂 的 节点 )。 因 此 ， 所 
需要 的 磁盘 访问 次 数 是 h+2s+1， 最 多 可 达到 3h+1。 


15.4.7 ”B- 树 的 删除 


删除 一 个 元 素 分 为 两 种 情况 : 1 ) 该 元 素 位 于 叶 节 点 ， 即 该 节点 的 所 有 孩子 都 是 外 部 节 
点 ; 2 ) 该 元 素 位 于 非 叶 节 点 。 情 况 2 ) 可 以 转变 为 情况 1 )， 过 程 是 用 一 个 元 素来 替换 被 删除 
元 素 ， 这 个 元 素 既 可 以 是 被 删除 元 素 的 左 相 邻 子 树 的 最 大 元 素 ， 也 可 以 是 被 删除 元 素 的 右 相 
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邻 子 树 的 最 小 元 素 。 替 换 元 素 必 在 叶 节 点 。 

考察 从 图 15-26a 中 删除 关键 字 为 80 的 元 素 。 因 为 该 元 素 不 在 叶 节 点 中 ， 所 以 要 找 一 个 
合适 的 替换 元 素 。 关 键 字 为 70 ( 左 相 邻 子 树 的 最 大 元 素 ) 和 82 ( 右 相 邻 子 树 的 最 小 元 素 ) 的 
元 素 成 为 候选 对 象 。 如 果 选 择 了 前 者 ， 那 么 下 一 步 便 是 从 节点 [20,30,40,50,60,70] 中 删除 70 
这 个 元 素 。 

如 果 要 从 图 15-26c 的 2-3 树 中 删除 关键 字 为 80 的 元 素 ， 那 么 既 可 以 选择 关键 字 为 70 的 
元 素 ， 也 可 以 选择 关键 字 为 82 的 元 素 作为 替换 元 素 。 如 果 选 择 后 者 ， 那 么 下 一 步 便 是 从 叶 节 
点 [82，85] 中 删除 82 这 个 元 素 。 

由 情况 2 ) 转化 为 情况 1 ) 很 容易 ， 因 此 我 们 只 讨论 情况 1 )。 如 果 要 删除 的 元 素 所 在 
的 叶 节 点 其 元 素 个 数 大 于 最 少数 (一 个 叶 节 点 ， 如 果 同 时 还 是 根 节点 ， 那 么 最 少 元 素 个 数 
是 1， 否 则 ， 最 少 元 素 个 数 是 [m/2]- 1 ) 那么 直接 删除 ， 然 后 将 修改 后 的 节点 写 回 磁盘 即 可 。 
从 图 15-26a 的 B- 树 中 删除 S0， 只 需 将 修改 后 的 节点 [20，30，40，60，70] 写 回 磁盘 即 可 。 
从 图 15-26c 的 2-3 树 中 删除 85， 只 需 将 节点 [82] 写 回 磁盘 即 可 。 在 这 两 种 情况 下 ， 在 沿 搜 
索 路 径 到 叶 节 点 的 过 程 中 需要 h 次 磁盘 访问 ， 将 修改 后 的 叶 节 点 写 回 磁盘 还 需要 一 次 额外 的 
磁盘 访问 。 

当 要 删除 的 元 素 在 一 个 非 根 节点 中 且 该 节点 的 元 素 个 数 最 少时 ， 可 用 其 最 邻近 的 左 兄 弟 
或 右 兄弟 中 的 元 素来 替换 它 。 注 意 ， 除 了 根 节点 以 外 ， 每 个 节点 都 会 有 一 个 最 邻近 的 左 兄弟 
或 一 个 最 邻近 的 右 兄弟 , 或 二 者 都 有 。 例 如 ， 从 图 15-26b 中 删除 元 素 25， 删 除 后 的 节点 是 
[20，30]， 元 素 个 数 是 2。 但 七 阶 B- 树 的 非 根 节点 至 少 要 有 3 个 元 素 。 它 最 邻近 的 左 兄弟 [2， 
3，4，6] 有 一 个 额外 的 元 素 ， 因 此 可 把 该 节点 的 最 大 元 素 移 至 其 父 节 点 ， 然 后 把 关键 字 为 10 
的 元 素 移 下 来 ， 结 果 如 图 15-27a 所 示 。 磁 盘 访问 次 数 是 2 ( 从 根 到 25 所 在 的 叶 节点 ) +1 ( 读 
取 该 叶 节 点 的 最 邻近 的 左 兄弟 ) +3 ( 写 回 修改 后 的 叶 节点 、 兄 弟 节点 和 父 节 点 ) =6。 

假如 对 删除 后 的 节点 [20，30]， 我 们 首先 检查 的 是 最 邻近 的 右 兄弟 [50，60，70]， 而 该 
节点 只 有 3 个 元 素 ， 不 能 从 中 删除 元 素 。( 如 果 这 个 节点 有 4 个 元 素 或 更 多 ， 就 把 其 最 小 元 素 
移 到 父 节点 ， 把 父 节点 中 位 于 两 个 兄弟 元 素 之 间 的 元 素 移 到 叶 节 点 ， 它 只 含 一 个 元 素 ) 然后 
检查 最 邻近 的 左 兄 弟 ， 碰 巧 它 有 一 个 额外 的 元 素 。 这 样 一 来 就 需要 一 次 额外 的 磁盘 访问 ， 而 
且 不 能 肯定 一 定 有 一 个 额外 元 素 。 为 了 降低 在 最 坏 情 况 下 的 磁盘 访问 次 数 ， 在 删除 一 个 元 素 
后 的 节点 缺少 一 个 元 素 时 ， 我们 只 考察 它 的 一 个 最 邻近 的 兄弟 。 

当 最 邻近 的 一 个 兄弟 不 包含 额外 元 素 时 ， 我 们 就 将 两 个 兄弟 与 父 节点 中 介 于 两 个 兄弟 之 
间 的 元 素 合 并 成 一 个 节点 。 由 于 这 两 个 兄弟 分 别 有 d-2 和 4d-1 个 元 素 ， 合 并 后 的 节点 共有 
24-2 个 元 素 。 当 m 是 奇数 时 ，2d-2 等 于 m-1 ; 而 当 m 是 偶数 时 ，24-2 等 于 m-2。 节 点 有 足 
够 的 空间 来 容纳 这 么 多 元 素 。 

在 本 例 中 ， 两 兄弟 [20，30] 和 [50，60，70] 以 及 关键 字 为 40 的 元 素 被 合并 成 一 个 节点 
[20，30，40，50，60，70]。 得 到 如 图 15-26a 所 示 的 B- 树 。 在 删除 过 程 中 ， 得 到 节点 [20， 
25，30] 需要 2 次 磁盘 访问 。 读 取 最 邻近 的 右 兄弟 需要 1 次 磁盘 访问 ， 将 两 个 修改 后 的 节点 写 
回 磁盘 还 需要 2 次 磁盘 访问 。 因 此 磁盘 访问 次 数 一 共 是 5 次 。 

合并 操作 必 减 少 父 节点 的 元 素 个 数 ， 父 节点 可 能 会 缺少 一 个 元 素 。 如 果 是 这 样 ， 那 么 需 
要 选择 父 节点 的 最 邻近 的 一 个 兄弟 ， 要 么 从 中 取 一 个 元 素 ， 要么 与 它 合 并 。 如 果 从 最 邻近 的 
右 ( 左 ) 兄弟 中 取 一 个 元 素 ， 那么 此 兄弟 节点 的 最 左 ( 最 右 ) 子 树 也 将 被 读 取 。 如 果 进 行 合 
并 ,那么 祖父 节点 也 可 能 会 缺少 一 个 元 素 ， 然 后 在 祖父 节点 重复 相同 的 过 程 。 最 坏 情 况 下 ， 
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这 种 过 程 会 一 直 回 溯 到 根 节 点 。 当 根 节点 缺少 一 个 元 素 时 ， 它 在 合并 之 后 变 成 空 节 点 ， 然 后 
被 删除 ， 树 的 高 度 减 1。 

假设 从 图 15-25 的 2-3 树 中 删除 10。 删 除 后 的 节点 不 含 任何 元 素 。 它 的 最 相 邻 右 兄弟 
[25] 没有 额外 的 元 素 ， 因 此 ， 两 个 兄弟 及 父 节点 ( 20 ) 的 元 素 被 合并 到 一 个 节点 ,结果 如 图 
15-27b 所 示 。 现 在 第 二 层 有 一 个 节点 缺少 一 个 元 素 ， 它 的 最 邻近 的 右 兄弟 有 一 个 额外 的 元 素 。 
把 该 兄弟 中 最 左边 的 元 素 ( 关键 字 为 50 的 元 素 ) 移 到 父 节点 中 ， 并 将 关键 字 为 30 的 元 素 移 
下 来 ， 结 果 如 图 15-27c 所 示 。 注 意 ， 节 点 [50，60] 的 左 子 树 也 要 移动 。 到 达 被 删除 元 素 所 在 
的 叶 节 点 需要 3 次 读 访 问 ， 取 得 第 二 和 三 层 的 最 邻近 右 兄弟 节点 需要 2 次 读 访问 ， 将 第 一 、 
二 和 三 层 的 4 个 修改 后 的 节点 写 回 磁盘 需要 4 次 写 访问 。 因 此 总 的 磁盘 访问 次 数 是 9 次。 
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让 站 由 而 面向 而 站 出 
a) 从 图 15-26b 中 删除 25 


2 下 J [soleol70| [82]84|86]88] 
而 血 
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b) 树叶 层 合并 之 后 
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c) 从 图 15-25 中 删除 10 
图 15-27 B- 树 的 删除 


最 后 一 个 例子 是 从 图 15-26c 的 2-3 树 中 删除 关键 字 为 44 的 元 素 。 删 除 后 ， 该 元 素 所 在 
的 叶 节 点 缺少 一 个 元 素 。 它 的 最 相 邻 左 兄弟 没有 额外 的 元 素 ， 因 此 两 兄弟 与 父 节点 中 的 元 素 
合并 ， 结 果 如 图 15-28a 所 示 。 现 在 第 三 层 有 一 个 节点 缺少 一 个 元 素 ， 它 最 邻近 的 左 兄 弟 没有 
额外 的 元 素 ， 因 此 两 兄弟 与 父 节 点 的 元 素 合并 ， 结 果 如 图 15-28b 所 示 。 现 在 第 二 层 有 一 个 节 
点 缺少 一 个 元 素 ， 它 最 邻近 的 右 兄 弟 不 含 额外 的 元 素 ， 执 行 合并 后 得 到 图 15-28c。 现 在 的 根 
节点 缺少 一 个 元 素 ， 即 为 空 节点 ， 因 此 根 节点 被 删除 。 最 后 的 2-3 树 如 图 15-28d 所 示 。 树 的 
高 度 就 减少 了 一 层 。 

找到 被 删除 元 素 所 在 的 叶 节点 需要 4 次 磁盘 访问 ， 最 邻近 的 兄弟 需要 3 次 读 取 磁盘 和 3 
次 写 磁盘 。 因 此 总 的 访问 量 是 10 次 。 

对 高 度 为 h 的 B- 树 实施 删除 操作 ， 最 坏 情 况 是 ， 合 并 操作 发 生 在 h，h-1，…，3 层 进行 
合并 ， 从 最 邻近 的 兄弟 中 获取 一 个 元 素 的 操作 发 生 在 第 2 层 。 在 最 坏 情况 下 磁盘 访问 次 数 是 
3p; (找到 被 删除 元 素 所 在 的 节点 需要 贿 次 读 访问 ) + (得 到 第 2 至 hh 层 的 最 邻近 兄弟 需要 hh-1 
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次 读 访问 ) + (在 第 3 至 nn 层 的 合并 需要 h-2 次 写 访问 ) + (对 修改 过 的 根 节点 和 第 2 层 的 2 
个 节点 进行 3 次 写 访问 )。 




















d) 删除 根 节点 之 后 
图 15-28 ”从 图 15-26c 的 2-3 树 中 删除 44 


15.4.8 节点 结构 
在 以 上 讨论 中 ,我 们 假定 节点 的 结构 如 下 : 


$, Co, ( e1,c1 ; ( e2,C2 » 人 (@s,cs ) 
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其 中 s 是 节点 的 元 素 个 数 ，e; 是 按 关键 字 升 序 排列 的 元 素 ，c; 是 孩子 指针 。 当 元 素 比 关键 字 
更 大 时 ， 可 以 采用 以 下 的 节点 结构 : 

5, Co, (ki,c1p1), (Kz,c2,p2), ***, (ks,cs,ps) 
其 中 不 ;是 元 素 的 关键 字 ，p; 是 相应 元 素 在 磁盘 中 的 位 置 。 利 用 这 种 结构 ， 我 们 可 以 使 用 更 高 
阶 的 B- 树 。 如 果 非 叶 节 点 不 含有 户 指针 ， 并 且 在 叶 节 点 中 用 疡 指针 替换 空 孩 子 指针 ， 就 可 
能 产生 更 高 阶 的 B- 树 ， 称 作 B“ 树 。 

另 一 种 可 能 是 用 平衡 二 又 搜索 树 描 述 每 一 个 节点 内 容 。 利 用 平衡 二 又 搜索 树 可 以 减少 B- 
树 的 阶 ， 因 为 对 于 每 个 元 素 都 需要 一 个 左 - 右 孩 子 指针 以 及 一 个 平衡 因子 或 颜色 域 。 但 是 将 
元 素 插 到 节点 或 从 节点 中 删除 一 个 元 素 所 花费 的 CPU 时 间 减 少 了 。 这 种 方法 能 否 导致 性 能 提 
高 取决 于 具体 的 应 用 。 在 某 些 情况 中 ， 较 小 的 m 可 能 能 增加 B- 树 的 高 度 ， 导 致 每 一 次 搜索 / 
插入 / 击 除 操作 需要 更 多 的 磁盘 访问 。 


练习 


57. 从 一 棵 空 的 2-3 树 开始 ， 依 次 插入 关键 字 20, 40, 30, 10, 25, 28, 27, 32, 36, 34, 35, 8,， 
6，2，3。 夯 出 每 一 次 插入 之 后 的 2-3 树 。 

58. 从 一 棵 空 的 2-3 树 开始 ， 依 次 插入 关键 字 2，1，5，6，7，,，4，3，8，9，10，11。 夯 出 每 

一 次 插入 之 后 的 2-3 树 。 

从 图 15-25 中 依次 删除 关键 字 55，40，70，35，60，95，90，82，80。 模 仿 图 15-28， 夯 
出 每 一 删除 的 步骤 。 

60. 1 ) 从 图 15-26c 的 2-3 树 中 删除 10。 模 仿 图 15-28， 画 出 删除 的 步骤 。 

2 ) 重 做 1 )， 不 过 从 图 15-26c 中 删除 的 是 70。 

3 ) 重 做 1 )， 不 过 从 图 15-26c 中 依次 删除 的 是 95 和 85。 

. 如 果 每 个 节点 占用 2 个 磁盘 块 并 且 需 要 2 次 磁盘 访问 才能 搜索 出 来 ， 那 么 在 一 棵 2m 阶 B- 
树 的 搜索 过 程 中 需要 的 最 大 磁盘 访问 量 是 多 少 ? 将 该 次 数 与 节点 大 小 占用 1 个 磁盘 块 的 m 
阶 B- 树 的 磁盘 访问 次 数 相 比 较 ， 并 论述 节点 大 小 大 于 磁盘 块 大 小 时 的 优点 。 

62. 从 一 个 m 阶 B- 树 的 非 叶 节点 中 删除 一 个 元 素 需 要 磁盘 访问 的 最 大 次 数 是 多 少 ? 

63. 假如 按 以 下 方法 修改 从 B- 树 中 删除 元 素 的 方式 : 如 果 一 个 元 素 既 有 最 邻近 的 左 兄弟 也 有 
最 邻近 的 右 兄弟 ， 那 么 在 合并 前 对 两 个 兄弟 都 要 做 检查 。 从 一 棵 高 度 为 h 的 B- 树 中 删除 
元 素 需 要 磁盘 访问 的 最 多 次 数 是 多 少 ? 

64. 一 棵 2-3-4 树 可 以 描述 为 一 棵 二 叉 树 ， 其 中 每 个 节点 要 么 是 红色 的 ,要么 是 黑色 的 。 在 
2-3-4 树 中 只 含有 一 个 元 素 的 节点 被 描述 为 黑色 节点 ; 含有 两 个 元 素 的 节点 被 描述 为 有 一 
个 红色 孩子 的 黑色 节点 (红色 孩子 可 以 是 黑色 节点 的 左 孩子 ， 也 可 以 是 右 孩 子 ); 含有 三 
个 元 素 的 节点 被 描述 为 有 两 个 红色 孩子 的 黑色 节点 。 

1 ) 画 一 棵 2-3-4 树 ， 其 中 至 少 包含 一 个 2 元素 节点 和 一 个 3 元素 节点 ， 用 上 述 方法 将 其 
画 成 带 颜 色 节 点 的 二 又 树 。 

2 ) 验证 该 二 又 树 是 一 棵 红 - 黑 树 。 

3 ) 证 明 当 用 上 述 方法 把 任意 二 又 树 描述 成 一 棵 带 颜色 的 二 又 树 时 ， 所 得 到 的 树 是 一 标 
红 - 黑 树 。 

4 ) 证 明 可 以 用 相反 的 映射 方式 把 任意 一 棵 红 - 黑 树 描述 成 一 棵 2-3-4 树 。 
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5 ) 验证 下 列 事实 : 对 于 红 - 黑 树 的 插入 操作 ，15.2.4 节 给 出 改变 颜色 和 旋转 的 方法 ， 也 
可 以 从 采用 4 ) 中 映射 模式 的 B- 树 插 入 方法 中 得 到 。 
6 ) 对 从 红 - 黑 树 中 删除 元 素 的 情况 重 做 5 )。 
65. 使 用 2-3 树 设 计 一 个 类 twoThree， 它 派生 于 抽象 类 dictionary ( 程序 10-1 )。 测 试 代 码 是 和 否 
正确 。 
66. 使 用 2-3-4 树 设计 一 个 类 twoThreeFour， 它 派生 于 抽象 类 dictionary ( 程序 10-1 )。 测 试 代 
码 是 否 正 确 。 


15.5 参考 及 推荐 读物 


AVL 树 是 由 G. Adelson-Velskii 和 E. Landis 在 1962 年 发 明 的 。 关 于 这 些 树 和 其 他 搜索 
树 的 更 多 资料 可 以 参考 D. Knuth. The Art Of Computer programming: Sorting and searching, 
Volume3. 2nd ed. Addision-Wesley, Reading MA, 1998. 

红 - 黑 树 是 由 R. Bayer 在 1972 年 发 明 ， 不 过 Bayer 将 这 种 树 叫 做 “对 称 的 平衡 B- 
树 ”， 红 - 黑 树 这 一 术语 是 Guibas 和 Sedgewick 在 更 详细 地 研究 了 这 种 树 之 后 于 1978 年 提出 
的 。 这 方面 的 先期 论文 有 R. Bayer Symmetric Binary B-Trees: Data Structures and Maintenance 
Algorithms. Acta Informatica, 1, 1972, 290~306, 以 及 L. Guibas, R. S. edgewick. A Dichromatic 
Framework for Balanced Trees. Proceedings of the 10th IEEE Symposium on Foundations of 
Computer Science, 1978, 8~21. 

关于 应 用 红 - 黑 树 实现 优先 搜索 树 方面 的 资料 可 参考 E. McCreight. Priority Search Trees. 
SIAM Journal on Computing, 14, 2, 1985, 257~276. 

具有 相同 渐 近 复杂 性 的 各 种 不 同 搜索 树 结构 可 参考 E. Horowitz, S. Sahni, D. Mehta. 
Fundamentals of Data Structures in C++. W. H. Freeman, New York, NY, 1994. 这 本 书 还 介绍 了 B- 
树 和 其 他 各 种 变化 的 B*- 树 。 

在 本 书 的 网 站 上 ， 你 可 以 找到 有 关 折 算 复杂 性 的 更 详尽 的 资料 。 不 要 忘记 ， 通 过 本 书 网 
站 ,你 还 要 了 解 诸如 单词 查找 树 和 后 级 树 等 其 他 搜索 结构 的 知识 。 
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概述 


恭喜 你 ! 已 经 成 功 穿越 了 “ 树 ” 的 深 林 ， 你 接 下 来 要 学 习 图 。 图 可 以 描述 的 实际 问题 成 千 
上 万 ， 数 量 之 多 ， 令 人 惊叹 ， 不 过 在 本 书 中 我 们 仅 研究 其 中 的 一 小 部 分 。 本 章 包括 如 下 内 容 : 

e 图 的 术语 : 顶点 、 边 、 邻 接 、 关 联 、 度 、 回 路 、 路 径 、 连 通 构件 、 生 成 树 。 

e 图 的 类 型 : 无 向 图 、 有 向 图 和 加 权 图 。 

e 图 的 常用 描述 方法 : 邻接 矩阵 、 和 矩阵 邻接 表 和 邻接 链表 。 

e 图 的 标准 搜索 方法 : 广度 优先 搜索 和 深度 优先 搜索 。 

。 图 的 算法 : 寻找 图 的 路 径 、 寻 找 无 向 图 的 连通 构件 、 寻 找 连通 无 向 图 的 生成 树 。 

还 有 一 些 算法 包含 在 后 续 章 节 中 ， 这 些 算法 有 : 拓扑 排序 、 二 分 覆盖 、 最 短路 径 、 最 小 
生成 树 、 最 大 团 、 旅 行 推销 员 。 


16.1 基本 概念 


简单 地 说 ， 图 (graph ) 是 一 个 用 线 或 边 连接 在 一 起 的 顶点 或 节点 的 集合 。 严 格 地 说 ， 
是 有 限 集 六 和 了 的 有 序 对 ， 即 G=(V.E)， 其 路 的 元 素 称 为 项 点 (也 称 节 点 或 点 )，E 的 元 素 
称 为 边 (也 称 弧 或 线 )。 每 一 条 边 连接 两 个 不 同 的 顶点 ， 而 且 用 元 组 (i, j) 来 表示 ， 其 中 i 
和 j 是 边 所 连接 的 两 个 顶点 。 

如 果 用 图 示 来 表示 一 个 图 ， 那 么 一 般 用 圆圈 表示 顶点 ， 用 线段 表示 边 。 例 如 ， 图 16-1 所 示 
的 图 。 在 该 图 中 ， 有 些 边 是 带 方向 的 ( 带 箭头 )， 而 有 些 边 是 不 带 方向 的 。 带 方向 的 边 叫 有 向 边 
( directed edge )， 而 不 带 方向 的 边 叫 无 向 边 (undirected edge )。 对 无 向 边 来 说 , (i, j) 和 (j, i) 
是 一 样 的 ; 而 对 有 向 边 来 说 ， 它 们 是 不 同 的 ， 前 者 的 方向 是 从 i 到 j， 后 者 是 从 j 到 i。? 


人 人 


by) 





图 16-1 图 





加 有 些 书 用 ij 表示 无 向 边 ， 用 (i,j) 表示 有 向 边 。 有 些 书 用 (i,j) 表示 无 向 边 ， 用 <i.j> 表示 有 向 边 。 本 书 用 同 
一 形式 (i,j) 表示 两 种 边 。 一 条 边 是 否 为 有 向 边 ， 上 下 文 可 以 清楚 地 表明 。 
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当 上 是 仅 当 (i,7 ) 是 图 的 边 ， 称 顶点 i 和 jj 是 邻接 的 (adjacent )。 边 (i,j ) 关联 (incident ) 
于 顶点 i 和 j。 图 16-1a 中 顶点 1 和 2 是 邻接 的 , 顶点 1 和 3, 1 和 4, 2 和 3, 3 和 4 也 邻接 的 。 
除 此 之 外 ， 这 个 图 没有 其 他 邻接 的 顶点 。 边 ( 1,2 ) 关联 于 顶点 1 和 2, (2,3 ) 关联 于 顶点 2 
和 3。 

对 有 向 图 的 邻接 和 关联 的 概念 做 更 精确 的 定义 有 时 非常 有 用 。 有 向 边 (i,j) 是 关联 至 
(incident to ) 顶点 /而 关联 于 (incident from ) 顶点 i。 顶 点 i 邻接 至 ( adjacent to ) 顶点 j,， 顶 
点 j 邻接 于 (adjacent from ) 顶点 i。 在 图 16-1c 中 ， 顶 点 2 邻接 于 项 点 1， 而 顶点 1 邻接 至 顶 
点 2。 边 (1,2) 关联 于 顶点 1， 而 关联 至 顶点 2。 顶 点 4 不仅 邻 接 至 顶点 3 且 邻 接 于 顶点 3。 边 
(3,4 ) 关联 于 顶点 3， 而 关联 至 顶点 4。 对 于 无 向 图 来 说 ,“ 至 ”和 “于 ”的 含义 相同 。 

如 果 使 用 集合 表示 方法 ， 图 16-1 的 几 个 图 可 以 用 如 下 方法 表示 : Gi= (VW,El)， 
G2=( 及 ,BE2) 和 G3=(V3,E3)， 其 中 : 


Vi={1,2,3,4}; E=1{(12), (3 QD (0) G4)} 
Vs={1,2,3,4,5,6,7}; E=;{(1,2), (1;3), (4,5), ($5,6), (5,7); (6,7)} 
V3={1,2,3,4,5}; E=3{(1,2), (2,3), (3,4), (4,3), (3,5), (5,4)} 


如 果 图 的 所 有 边 都 是 无 向 边 ， 那 么 该 图 叫做 无 向 图 (undirected graph )， 图 16-1a 和 
图 16-1lb 都 是 无 向 图 。 如 果 图 的 所 有 边 都 是 有 向 边 ， 那 么 该 图 叫做 有 向 图 ( directed graph 或 
digraph )， 图 16-1c 是 一 个 有 向 图 。 

根据 定义 ， 一 个 图 不 能 有 重复 的 边 。 在 无 向 图 的 任意 两 个 顶点 之 间 ， 最 多 只 能 有 一 条 边 。 
在 有 向 图 的 任意 两 个 项 点 i 和 j 之 间 ， 从 顶点 i 到 顶点 j 最 多 有 一 条 边 ， 从 顶点 j 到 顶点 i 也 
最 多 有 一 条 边 。 一 个 图 不 可 能 包含 自 连 边 ( self-edge )， 即 (ii) 形式 的 边 。 自 连 边 也 叫做 环 
(loop )。 

在 图 的 一 些 应 用 中 ， 我 们 可 能 要 为 每 条 边 赋予 一 个 表示 成 本 的 值 ， 我 们 称 之 为 权 。 这 时 
的 图 称 为 加 权 有 向 图 ( weighted digraph ) 和 加 权 无 向 图 ( weighted undirected graph )。 一 个 网 
络 ( network ) 经 常 指 一 个 加 权 有 向 图 或 加 权 无 向 图 。 实 际 上 ， 所 有 的 图 都 可 以 看 做 是 特殊 的 
网 络 一 一 一 个 无 向 (有 向 ) 图 可 以 看 做 是 一 个 所 有 边 上 的 权 都 相同 的 无 向 (有 向 ) 网 络 。 


16.2 ”应 用 和 更 多 的 概念 


无 向 图 、 有 向 图 和 网 络 常常 用 于 电子 网 络 的 分 析 、 化 合 物 ( 特别 是 碳 氧 化合物 ) 的 分 子 
结构 研究 、 空 中 航线 和 通信 网 络 的 描述 、 项 目 策划 、 遗 传 研究 、 统 计 、 社 会 科学 等 很 多 种 领 
域 。 这 一 节 将 用 图 来 确切 地 描述 一 些 实际 问题 。 

例 16-1[ 路 径 问 题 ] 城市 有 许多 街道 ， 每 一 个 路 口 都 可 以 看 做 有 向 图 的 一 个 顶点 ， 邻 接 
的 两 个 路 口 之 间 的 街道 ， 如 果 是 双 行 线 ， 就 可 以 看 做 两 条 有 向 边 ， 如 果 是 单行 线 ， 就 可 以 看 
做 一 条 有 向 边 。 图 16-2 是 假想 的 街道 地 图 和 相应 的 有 向 图 。 它 有 三 条 街道 : 街道 1， 街 道 2， 
和 街道 3。 有 两 条 大 街 : 大 街 1 和 大 街 2。 路 口 用 数字 1 到 6 编号 。 相 应 的 有 向 图 如 图 16-2b 
所 示 ， 其 顶点 标号 与 图 16-2a 的 路 口 标号 相同 。 

一 个 顶点 序列 P=il，i,，…， 计 是 图 或 有 向 图 G=(V,B) 的 一 条 从 站 到 六 的 路 径 ， 当 且 仅 
当 对 于 每 个 j(1 < j< 有 司 ， 边 (i,ijwi) 都 在 BE 中 。 从 路 口 i 到 j 存在 一 条 路 径 ， 当 且 仅 当 在 相应 的 
有 了 向 图 中 ， 从 顶点 i 到 /有 一 条 路 径 。 在 图 16-2b 的 有 向 图 中 ,5, 2, 1 是 从 5 到 1 的 一 条 路 径 。 
在 这 个 有 向 图 中 ， 从 5 到 4 之 间 没 有 路 径 。 


了 92 锚 二 部 分 鸡 据 结 祥 





街道 1 街道 2 街道 3 














i oe way (9) (9) (©) 
a) 街道 地 图 b) 有 向 图 
图 16-2 街道 地 图 及 其 相应 的 有 向 图 加 


一 条 路 径 ， 如 果 除 第 一 个 和 最 后 一 个 顶点 之 外 ， 其 余 所 有 顶点 均 不 同 ， 那 么 该 路 径 称 为 
一 条 简单 路 径 ( simple path )。 路 径 5，2，1 是 简单 路 径 ， 而 2，5，2，1 不 是 。 

图 或 有 向 图 的 每 一 条 边 都 可 以 有 长 度 。 一 条 路 径 的 长 度 是 该 路 径 的 所 有 边 长 度 之 和 。 
从 路 口 i 到 路 口 j 的 最 短 道路 是 在 相应 的 网 络 ( 即 加 权 有 向 图 ) 中 从 顶点 i 到 顶点 j 的 最 短 
路 径 。 

例 16-2[ 生成 树 ] 设 G=(T, 忆 是 一 个 无 向 图 。G 是 连通 的 (connected )， 当 且 仅 当 G@ 的 
每 一 对 顶点 之 间 都 有 一 条 路 径 。 图 16-1a 的 无 向 图 是 连通 的 ， 而 图 16-1b 的 无 向 图 不 是 。 假 定 
G 是 一 个 通信 和 网络, 表示 城市 的 集合 ,E 表示 通信 和 链 路 的 集合 。V 的 每 一 对 城市 之 间 可 以 通信 ， 
当 且 仅 当 G 是 连通 的 。 在 图 16-1a 的 通信 网络 中 ,城市 2 和 4 可 以 通过 路 径 2,3,4 进行 通信 ， 
而 在 图 16-1b 的 网 络 中 ， 城 市 2 和 4 不 能 通信 。 

假设 G 是 连通 的 , 但 是 G 的 有 些 边 对 连通 性 来 说 是 不 必要 的 ， 去 掉 这 些 边 依然 连通 。 在 
图 16-1a 中 ， 即 使 去 掉 边 (2，3 ) 和 ( 1，4 )， 整 个 图 仍然 连通 。 

如 果 厂 的 顶点 和 边 的 集合 分 别 是 G 的 顶点 和 边 的 集合 的 子 集 ， 那 么 称 图 互 是 图 G 的 子 
(subgraph )。 一 条 始点 和 终点 相同 的 简单 路 径 称 为 环 路 (cycle)。 例如，1， 2,，3，1 是 
图 16-1a 的 一 条 环 路 。 没 有 环 路 的 连通 无 向 图 是 一 棵 树 。 一 个 G 的 子 图 ， 如 果 包 含 G 的 所 有 
顶点 ， 且 是 一 棵 树 ， 则 称 为 G 的 生成 树 ( spanning tree )。 图 16-1a 的 生成 树 如 图 16-3 所 示 。 


依 少 小池 中] 


图 16-3 图 16-1a 的 一 些 生成 树 


一 个 具有 7 个 顶点 的 连通 无 向 图 至 少 有 m=1 条 边 。 因 此 ， 当 连通 网 络 的 每 条 链 路 的 建造 
成 本 都 相同 时 ， 任 意 一 棵 生成 树 的 建设 成 本 都 可 以 将 网 络 建 设 成 本 减 至 最 小 ， 并 保证 网 络 的 
连通 。 如 果 不 同 的 链 路 具有 不 同 的 建造 成 本 ， 那 么 需要 在 一 棵 成 本 最 小 的 生成 树 ( 生成 树 的 
成 本 是 所 有 链 路 的 成 本 之 和 ) 上 建设 链 路 。 图 16-4 是 一 个 图 和 它 的 两 棵 生成 树 。 国 

例 16-3[ 翻译 人 员 ] 假设 你 正在 策划 一 次 国际 会 议 。 所 有 发 言 人 都 只 会 说 英语 ， 而 每 一 
个 与 会 人 员 所 懂得 的 语言 是 Ll1，L2,，…，Ln 中 的 一 种 。 翻译 小 组 可 以 在 英语 和 其 他 语言 
间 互 译 。 现 在 的 任务 是 如 何 使 翻译 小 组 的 人 数 最 少 。 
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我 们 可 以 把 这 个 任务 准确 地 表示 为 一 个 图 的 问题 。 在 这 个 图 中 有 两 组 项 点 : 一 组 与 翻译 
人 员 对 应 ， 另 一 组 与 语言 对 应 ( 见 图 16-5 )。 在 翻译 人 员 i 与 语言 之 间 存 在 一 条 边 ， 当 和 且 
仅 当 翻译 人 员 i 能 够 将 英语 和 语言 L/ 互 译 。 翻 译 人 员 i 覆盖 语言 Li， 当 目 仅 当 有 一 条 边 连 接 
翻译 人 员 i 和 语言 Li。 我 们 需要 找到 能 够 覆盖 所 有 语言 项 点 的 最 小 翻译 人 员 顶 点 集 。 

图 16-5 的 项 点 被 分 为 两 个 子 集 : 4 ( 翻译 人 员 顶 点 ) 和 B (语言 项 点 )。 每 条 边 都 有 一 个 
顶点 在 4 中 ， 另 一 个 顶点 在 8 中。 具有 这 种 特征 的 图 叫 二 分 图 ( bipartite graph )。 加 





Cost= 110 Cost= 129 
a) 图 b) 成 本 为 110 的 生成 树 ”c) 成 本 为 129 的 生成 树 
图 16-4 连通 图 和 它 的 两 棵 生成 树 图 16-5 翻译 人 员 与 语言 


练习 


1. 考虑 图 16-4b。 下 面 哪 一 条 是 简单 路 径 ? 为 什么 ? 
1) 6 1 Bs 7 4 


人 5 
eh 
4)4, 5, 7, 2 

2. 1 ) 列举 出 在 图 16-1a 的 顶点 1 和 4 之 间 的 所 有 简单 路 径 。 


2 ) 列举 出 在 图 16-4a 的 顶点 1 和 7 之 间 的 所 有 简单 路 径 。 
3 ) 列举 出 在 图 16-4a 的 顶点 3 和 6 之 间 的 所 有 简单 路 径 。 
4) 列举 出 在 图 16-lc 中 ， 从 顶点 4 到 1 的 所 有 简单 路 径 。 
5 ) 列举 出 在 图 16-2b 中 ， 从 顶点 4 到 1 的 所 有 简单 路 径 。 

3. 画 出 图 16-1a 的 所 有 子 图 。 

4. 列举 出 图 16-4a 的 所 有 环 路 。 

5. 列举 出 图 16-2b 的 所 有 环 路 。 

6. 画 出 图 16-4a 的 两 个 以 上 的 生成 树 。 给 出 每 一 棵 生成 树 的 成 本 。 

7. Anita、Beth 、Jack 和 Roger 申请 书店 的 一 份 工 作 。Anita 可 以 在 周一 、 周 三 和 周 五 上 班 ; 
Beth 可 以 在 周一 、 周 二 和 周 四 上 班 ; Jack 可 以 在 周 日 、 周 一 和 周 六 上 班 ; Roger 可 以 在 周 
四 和 周 五 上 班 。 画 一 张 二 分 图 ， 其 中 顶点 表示 求职 者 和 一 周 的 每 一 天 , 边 连 接 求职 者 和 他 
的 工作 日 。 选 择 可 以 覆盖 每 一 天 的 最 小 求职 者 数 。 

8. 举 出 另外 两 个 可 以 用 二 分 图 来 描述 的 实际 问题 。 
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16.3 ”特性 


在 一 个 无 向 图 中 ， 与 一 个 顶点 i 相关 联 的 边 数 称 为 该 项 点 的 度 (degree ) d;。 在 图 16-1a 
中 ， d1=3， d2=2,， d3=3， d4=2。 
特性 16-1 设 G= (WV, 互 ) 是 一 个 无 向 图 。 令 1=| 凡 ，e=| 如 ， 则 


1) Ya = 2e 

2)0=<e=n(n-1)2 

证 明 ”在 无 向 图 中 ， 每 一 条 边 都 与 两 个 顶点 相关 联 ， 因 此 顶点 的 度 之 和 是 边 数 的 2 售 。1) 
得 证 。 一 个 顶点 的 度 在 0 到 n-1 之 间 ， 因 此 度 的 和 在 0 到 n(n-1) 之 间 。 从 1) 可 知 , e 是 在 0 
到 n(n-1)/2 之 间 。 国 


一 个 具有 nn 个 顶点 和 n(n-1)/2 条 边 的 无 向 图 是 一 个 完全 图 (complete graph )， 用 天 表 
示 。 图 16-6 是 n=1，2，3 和 4 时 的 完全 无 向 图 。 





a) K b) 天 c) Kk, 


图 16-6 ”完全 无 向 图 


设 G 是 一 个 有 向 图 。 顶 点 i 的 入 度 (in-degree ) 4d? 是 指 关联 至 该 顶点 的 边 数 。 顶 点 i 的 出 
度 (out-degree ) d™ 是 指 关 联 于 该 顶点 的 边 数 。 对 于 图 16-1ce,dY=0, d=1,， dy3=], d=1， 
洲 翅 于， 

特性 16-2 设 G= (了 WE) 是 一 个 有 向 图 。 令 1=| 媳 ，e=| 可 ， 则 


1)0<e=n(n-1) 
2) 2 d= Yd"=e 
i=1 i=1 


证 明 ”作为 练习 10。 男 
一 个 具有 个 顶点 的 完全 有 向 图 ( complete graph ) 恰好 包含 n(n-1) 条 有 向 边 。 图 16-7 
给 出 了 n=1，2，3 和 4 时 的 完全 有 向 图 。 


© 


a) kK b) Kk, C) Ek, 


图 16-7 完全 有 向 图 





在 无 向 图 中 ， 入 度 和 出 度 可 以 看 做 是 度 的 同义词 。 本 节 提 供 的 定义 可 以 直接 扩充 到 网 
络 中 。 . 
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练习 


对 于 图 16-8 的 每 一 个 图 ， 确 定 下 列 的 值 : 
1 ) 每 个 顶点 的 人 度 。 


2 


2 ) 每 个 顶点 的 出 度 。 (2 

3 ) 邻接 于 顶点 2 的 顶点 集合 。 sw 

4 ) 邻接 至 顶点 1 的 顶点 集合 。 :>。 
5 ) 关联 于 顶点 3 的 边 的 集合 。 3 





6 ) 关联 至 顶点 4 的 边 的 集合 。 
7 ) 所 有 的 有 向 环 路 和 它们 的 长 度 。 
10. 证 明 特 性 16-2。 be 
11. 设 G 是 任意 无 向 图 。 证明 有 偶数 个 度数 为 奇数 的 顶点 。 
12. 设 G=( 亿 E) 是 |M>1 的 连通 图 。 证 明 它 包含 一 个 度数 为 1 的 顶点 或 环 路 (或 两 者 都 有 )。 
13. 设 G= (了,E) 是 至 少 包含 一 个 环 路 的 无 向 连通 图 ， 边 (i,j ) E 五 至 少 出 现在 一 个 环 路 中 。 
证 明 图 =(V,E-{(i, 站 }) 也 是 连通 的 。 
14. 证 明 : 
1 ) 对 于 每 一 个 n(n > 1)， 都 存在 一 个 恰 有 n-1 条 边 的 无 向 连通 图 。 
2 ) 每 一 个 具有 n 个 顶点 的 无 向 连通 图 至 少 有 n-1 条 边 。 可 以 使 用 前 面 两 个 练习 的 结论 。 
15. 一 个 有 向 图 是 强 连 通 ( strongly connected ) 的 ， 当 且 仅 当 对 于 每 一 对 不 同 顶点 上 和 7] 从 i 
到 j 和 从 j 到 i 都 有 一 条 有 向 路 径 。 
1 ) 证 明 对 于 每 一 个 n(n 三 2 )， 都 存在 一 个 恰 有 n 条 边 的 强 连通 有 向 图 。 
2 ) 证 明 每 一 个 具有 n(n 二 2) 个 顶点 的 强 连通 有 向 图 至 少 包 含 h 条 边 , n > 2。 


16.4 ”抽象 数据 类 型 graph 


抽象 数据 类 型 graph 适用 于 各 种 图 : 有 向 图 、 无 向 图 、 加 权 图 和 无 权 图 。ADT 16-1 只 列 
出 了 图 操作 的 一 小 部 分 。 随 着 学 习 的 深入 ， 我 们 还 会 加 入 一 些 操作 。 


抽象 数据 类 型 graph 
{ 
实例 
顶点 集合 广 和 边 集合 E 
操作 
numberOfVertices(): 返回 图 的 顶点 数 
numberOfEdgeli, 四 : 返回 图 的 边 数 


existsEdge(i, 站 : 如 果 边 (i,j) 存在 ， 返 回 true， 否 则 返回 false 
insertEdge(theEdge): 删除 边 (i 站) 
eyaseEdge(i 站 : 删除 边 
degree( 站 : 返回 项 点 i 的 度 。 只 用 于 无 向 图 
inDegree( 门 : 返回 项 点 i 的 入 度 
outDegree(i) 返回 顶点 i 的 出 度 
}; 





ADT 16-1 图 的 抽象 数据 类 型 描述 
与 我 们 前 几 章 看 到 的 抽象 类 不 同 ， 与 ADT graph 对 应 的 抽象 类 包含 一 些 纯 虚 方法 ， 以 及 
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一 些 在 本 类 中 实现 的 方法 。 后 者 将 利用 迭代 器 从 一 个 给 定 的 顶点 开始 ， 根 据 相 邻 的 关系 ， 依 
次 访问 所 有 的 顶点 。 一 些 方法 还 需要 知道 它 所 操作 的 图 是 否 有 向 及 是 否 加 权 。 因 此 我 们 增加 
图 graph 的 抽象 数据 类 型 (ADT 16-1 )， 它 具有 完成 这 些 任 务 的 方法 。 程 序 16-1 是 据 此 产生 
的 C++ 抽象 类 。 对 加 权 图 ，T 是 边 上 的 权 的 数据 类 型 。 对 无 权 图 ，T 是 布尔 类 型 。 


程序 16-1 抽象 类 graph 


template<class T> 
class graph 
{ 
Bublies 
virtual ~graph() {} 


/1/ ADT 方法 

virtual int numberOfVertices() const = 07 
virtual int numberOfEdges() const = 0; 
virtual bool existsEdge (int, int) const = 0; 


virtual void insertEdge (edge<T>*) = 0; 

virtual void eraseEdge (int, int) = 0; 

virtual int degree (int) const = 0; 

virtual int inDegree(int) const = 0; 

virtual int outDegree (int) const = 0; 

/其 他 方法 

virtual bool directed() const = 0; 1/ 当 且 仅 当 是 有 向 图 时 ， 返 回 值 是 true 
virtual bool weighted() const = 0; 1/ 当 且 仅 当 是 加 权 图 时 ， 返回 值 是 true 
virtual vertexIterator<T>* iterator (int) = 0; 外 访问 指定 顶点 的 相 邻 顶点 


} 


方法 insertEdge 的 输入 数据 的 类 型 是 模板 类 edge。 模 板 类 edge 是 一 个 抽象 类 ， 它 具有 方 
法 vertex1 、vertex2 和 weight， 这 些 方法 的 返回 值 分 别 是 一 个 边 的 第 一 个 顶点 ， 第 二 个 顶点 和 
权 。 程 序 16-1 还 用 到 了 模板 类 vertexIterator， 这 是 一 个 抽象 类 ， 它 只 包含 虚 析 构 函 数 和 纯 虚 
方法 。 


virtual int next()=0)， 
virtual int next (T&)=0; 


vertexIterator<T> *vertex5Iterator=iterator (5);} 


接 下 来 的 调用 语句 vertex5Iterator->next() 将 返回 一 个 与 顶点 5 相 邻 的 顶点 , 假设 是 j， 这 
时 (5, 7/ ) 是 图 的 一 条 边 。 如 果 没 有 相 邻 的 顶点 ， 返 回 值 是 0。 当 g 指向 的 是 一 个 加 权 图 时 ， 
假设 调用 语句 vertex5Iterator->next(w) 的 返回 值 是 ij， 这 时 w 成 为 边 (5, j) 的 权 。 


16.5 无 权 图 的 描述 
对 无 向 图 最 常用 的 描述 方法 都 是 基于 邻接 的 方式 : 邻接 矩阵 邻接 链表 和 邻接 数组 。 
16.5.1 ”邻接 矩阵 


一 个 n 顶点 图 G=(V.A) 的 邻接 矩阵 ( adjacent matrix ) 是 一 个 nxn 的 矩阵 (假设 是 4 )， 其 
中 每 个 元 素 是 0 或 1。 假设 大 {1,2,3…,n}。 如 果 G 是 一 个 无 向 图 ， 那 么 其 中 的 元 素 定 义 如 下 : 
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1 如 果 (ij))EE 或 (ji)jeE 


《| (16-1) 
0 其 他 
如 果 G 是 有 向 图 ， 那么 其 中 的 元 素 定义 如 下 : 
< 如 果 (ij) EE 16-2 
0 其 他 \ , 
16-1 的 邻接 矩阵 如 图 16-9 所 示 。 
从 公式 (16-1) 和 公式 (16-2) 可 1234567 
以 立即 得 到 以 下 结论 : ) A . - : i 
1) 对 于 7 项 点 的 无 向 图 ， 有 4(D= 1234 3llooooool i11000 
0，1 <i<n, 了 | 人 4|0000100| 2l00100 
| 下 Oi Io lo otri 
2) 无 向 图 的 邻接 矩阵 是 对 称 的 ，3|1 1 o 1| slooooloill 400100 
即 4Gi,))=4A(j,D), 1 <i<n,1l<js<n, 4|1010| 7l0000110| 5loool10 
a) b) 本 c) 加 











3) 对 于 ”顶点 的 无 向 图 有 
2 4(07)= 之 400=d4( 相 是 项 点 的 度 ) 


4 ) 对 于 nn 顶点 的 有 向 图 ， 有 之 407)=d 和 之 400=d， 1<i<n, 

将 邻接 矩阵 映射 到 数组 。 

利用 映射 4(i,j)=1， 当 和 且 仅 当 ali] 四 是 true, 1 寺 i <n, 1<j<n， 可 以 把 nxn 邻接 和 矩 
阵 4 映射 到 一 个 (n+1) x (n+1) 的 布尔 型 数组 ， 它 需要 (n+1) 字 节 。 另 一 种 方法 是 ， 利 用 映射 
4(i, 站 =1， 当 且 仅 当 ali-1]jj-1] 是 true, 1 <i<n, 1<j<n， 可 以 把 nxn 令 接 和 矩阵 4 映射 
到 一 个 nxn 的 布尔 型 数组 ， 它 需要 wr 字 节 ， 比 前 一 种 减少 2n+1 字 节 。 

因为 所 有 对 角 线 元 素 都 是 零 而 不 需 
要 储存 ， 所 以 还 可 以 进一步 减少 nn 字 节 的 
存储 空间 。 把 对 角 线 元 素 去 掉 ， 可 得 到 一 
个 上 (或 下 ) 三 角 和 矩阵 ( 见 7.3.4 节 ) 这 
些 三 角 和 矩阵 可 以 压缩 到 一 个 (n-1)xn 的 
矩阵 中 ， 如 图 16-10 所 示 。 图 的 阴影 部 分 
是 原 邻接 矩阵 的 下 三 角形 部 分 。 

上 述 的 方法 减少 的 存储 空间 并 不 
大 , 但 是 代价 不 小 ， 因 为 项 点 的 外 部 索引 和 在 图 中 的 内 部 描述 不 匹配 。 这 样 一 来 ， 不 仅 代码 
容易 出 错 ， 而 且 访 问 边 的 时 间 也 会 增加 。 因 此 我 们 还 将 使 用 (n+1) x (n+1) 的 数组 映射 。 

无 向 图 邻接 矩阵 是 对 称 的 ( 见 7.3.5 节 )， 因 此 只 需要 存储 上 三 角 (或 下 三 角 ) 的 元 素 ， 
所 需 空间 仅 为 (wn)/2 字 节 。 使 用 7.3.5 节 的 方法 ， 可 以 减少 50% 的 存储 空间 ， 这 对 大 型 图 来 
说 是 很 有 意义 的 。 

使 用 邻接 矩阵 时 ， 要 确定 邻接 至 或 邻接 于 一 个 给 定 节点 的 集合 需要 用 时 @(m)。 然 而 ， 增 
加 或 删除 一 条 边 仅 需 要 用 时 8(1)。 


16.5.2 ”邻接 链表 
一 个 顶点 i 的 邻接 表 (adjacency list ) 是 一 个 线性 表 ， 它 包含 所 有 邻接 于 顶点 i 的 顶点 。 


图 16-9 图 16-1 的 邻接 矩阵 





图 16-10 图 16-9 去 掉 对 角 线 元 素 后 的 邻接 矩阵 
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在 一 个 图 的 邻接 表 描 述 中 ， 图 的 每 一 个 顶点 都 有 一 个 邻接 表 。 当 邻接 表 用 链表 表示 时 ， 就 是 
邻接 链表 (linked-adjacency-list )。 

我 们 可 以 使 用 类 型 为 链表 的 数组 aList 来 描述 所 有 邻接 表 。aList[i].firstNode 指向 顶点 i 
的 邻接 表 的 第 一 个 顶点 。 如 果 x 指向 链表 aList[j] 的 一 个 顶点 ， 那 么 ( i，x->element ) 是 图 的 
一 条 边 ， 其 中 element 的 数据 类 型 是 整 型 int。 图 16-11 是 图 16-1 的 邻接 链表 描述 。 


aList vertex next 


Ee EI 





























>| 4 =|1|N 












































aList aList 
N 
| 二 =[ 6| 汪 
[561N 
b) N 表 示 一 个 NULL 空 链表 ©) 


图 16-11 图 16-1 的 邻接 链表 


一 个 指针 和 一 个 整数 各 需要 4 字 节 的 存储 空间 ， 因 此 用 邻接 链表 描述 一 个 n 顶点 图 需要 
8(n+1) 字 节 存储 ntl 个 firstNode 指针 和 aList 链 表 的 listSize 域 ， 需 要 4*2*m 字 节 存储 m 个 
链表 节点 ， 每 个 链表 节点 的 两 个 域 next 和 element 各 需 4 字 节 ， 其 中 对 无 向 图 ，m=2e， 对 有 
向 图 m=e， 其 中 e 是 边 数 。 

当 e 远 远 小 于 必 时 ， 邻 接 链 表 比 邻接 矩阵 需要 更 少 的 空间 。 例 如 ， 一 个 e=n 的 有 向 图 ， 
用 邻接 链表 描述 需要 16n+8 字 节 ， 用 压缩 的 邻接 矩阵 描述 需要 到 字 节 。 因 此 ， 当 e=a = 17 
时 ， 邻 接 链 表 描述 所 需 空间 更 少 。 

在 邻接 链表 描述 中 ， 确 定 邻 接 于 顶点 i 的 顶点 需 用 时 @ ( 邻接 于 顶点 i 的 顶点 数 )。 插 和 人 
或 删除 一 条 边 (i,j) 的 用 时 ， 对 无 向 图 是 O(4di+qj))， 对 有 向 图 是 O( qe )。 


16.5.3 ”邻接 数组 


在 邻接 数组 中 ， 每 一 个 邻接 表 用 一 个 数组 线性 表 而 非 链表 来 描述 。 例 如 ， 邻 接 链 表 的 数 
组 aList 的 数据 类 型 现在 可 以 是 arrayList ( 见 程序 5-3 )。 另 一 个 选择 是 用 二 维 不 规则 数组 ( 见 
7.1.6 节 ) aList[][]， 其 中 aList[i] 容量 等 于 顶点 i 的 邻接 表 长 度 。 图 16-12 是 图 16-1 的 邻接 数 
组 描述 。 你 可 以 把 aList[i] 看 做 是 一 个 一 维 数组 或 一 个 arrayList 实例 。 











aList 








a) 
图 16-12 图 16-1 对 应 的 邻接 链表 


邻接 数组 比邻 接 链表 少 用 4m 字 节 ， 因 为 不 需要 next 指针 域 ( 这样 的 指针 域 有 m 个 )。 
而 大 部 分 的 图 操作 ， 无 论 是 用 邻接 链表 ， 还 是 用 邻接 数组 ， 其 渐 近 时 间 复 杂 性 是 相同 的 。 但 
是 ， 根 据 6.1.6 节 和 8.4.3 节 的 实验 ， 我们 认为 ， 对 大 部 分 的 图 操作 ， 邻 接 数组 的 用 时 要 少 于 
邻接 链表 。 

注意 ， 对 邻接 矩阵 和 邻接 表 所 做 的 空间 需求 分 析 是 渐 近 分 析 ， 而 实际 的 实现 所 需 空间 可 
能 要 多 一 些 ， 因 为 实际 的 代码 可 能 要 存储 诸如 顶点 和 边 的 个 数 ， 这 些 量 在 我 们 的 分 析 中 没有 
考虑 。 


练习 


16. 为 图 16-2b 画 出 下 列 描述 图 ; 
1 ) 邻接 矩阵 。 
2 ) 邻接 链表 。 
3 ) 邻接 数组 。 
17. 对 图 16-4a 完成 练习 16。 
18. 对 图 16-5 完成 练习 16。 
19. 对 图 16-8a 完成 练习 16。 
20. 对 图 16-8b 完成 练习 16。 
21. 假设 用 一 个 布尔 型 数组 来 表述 邻接 矩阵 ， 如 图 16-10 所 示 。 对 角 线 不 存储 。 编 写 方法 set 
和 get 分 别 存储 和 搜索 4(i,j) 的 值 ， 每 一 个 方法 的 复杂 性 应 为 @ (1 )。 
22. 用 无 向 图 完成 练习 21， 用 一 维 布尔 型 数组 a 仅 存 下 三 角 和 矩阵 。 
23. 假设 用 一 个 nxn 的 布尔 型 数组 a 来 描述 一 个 有 向 图 的 nxn 邻接 矩阵 。 编 写 一 个 方法 ， 确 
定 边 的 数量 。 时 间 复 杂 性 应 为 O(n”)。 并 给 出 证 明 。 
24. 假设 用 邻接 数组 来 描述 一 个 无 向 图 ( 见 图 16-12 )。 
1 ) 编写 一 个 方法 删除 边 (i,j)。 代 码 的 复杂 性 是 多 少 ? 
2 ) 编写 一 个 方法 增加 边 (i,7)。 代 码 的 复杂 性 是 多 少 ? 
25. 用 邻接 链表 ( 见 图 16-11 ) 完成 练习 23。 
26. 用 邻接 链表 完成 练习 24。 
27. 对 有 向 图 完成 练习 24。 
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28. G 是 用 一 个 nn 个 顶点 、e 条 边 的 无 向 图 。e 至 少 是 多 少时 ，G 的 邻接 矩阵 才 会 比邻 接 数组 
占用 较 少 的 空间 ? 
29. 对 有 向 图 G 完成 练习 28。 


16.6 ”加 权 图 的 描述 


将 无 权 图 的 描述 进行 简单 扩充 就 可 得 到 加 权 图 的 描述 。 用 成 本 邻接 矩阵 ( cost-adjacency- 
matrix ) C 描述 加 权 图 。 如 果 C(i,j) 表示 边 (27) 的 权 ， 那 么 它 的 使 用 方法 和 邻接 矩阵 的 使 用 方 
法 一 样 。 在 这 种 描述 方法 中 ， 需 要 给 不 存在 的 边 指定 一 个 值 ， 一 般 是 一 个 很 大 的 值 。 在 实现 
代码 中 ， 我 们 要 求 用 户 用 noEdge 表示 这 个 值 。 图 16-13 是 图 16-1 的 一 种 成 本 邻接 矩阵 。 破 
折 号 表示 不 存在 的 边 。 

如 果 链 表 的 元 素 有 两 个 域 vertex 和 weight， 就 可 以 从 相应 的 无 权 图 的 邻接 链表 得 到 加 
权 图 的 邻接 链表 。 图 16-14 的 邻接 链表 描述 了 图 16-13a 的 成 本 邻接 矩阵 。 元 素 第 一 个 域 是 
vertex， 第 二 个 域 是 weight。 



















































1 这 多 43 
1 [= 5 = = aList 
RE 219--- -一 - 了 0 | 二 =[418| o>214| 下 [37 
| Ee 
1 三 未 六 本 本 | 一 -一 一 3 2|--3- -| 加 | 孝王 =L4LN 
bE 二 车 二 | 阁 | 二 妆 二 人 | 三 = 有 7 ; 
引 | 汪 省 | 证 二 尖 4|- -6--| BI 0 于 =[416 ily]| 
HL 和 -下 了 | 这 下 5|~---5- 中 | 。 1[8[ 村 >[3T6TN] 
a) by) C) 
破 折 号 表示 不 存在 的 边 NN 表示 空 链表 
图 16-13 图 16-1 对 应 的 可 能 的 成 本 邻接 矩阵 图 16-14 ”加 权 图 16-13a 的 邻接 链表 





如 果 每 一 个 元 素 用 数 对 (vertex，weight ) 表示 ， 就 可 以 从 相应 的 无 权 图 的 数组 邻接 矩阵 
得 到 加 权 图 的 数组 邻接 和 矩阵。 这 种 撒 述 方法 与 图 16-14 的 描述 方法 仅 有 一 点 区 别 : 没有 next 
指针 。 注 意 ， 邻 接 表 对 不 存在 的 边 不 需要 赋值 。 


练习 


30. 对 图 16-13a 和 图 16-13b 的 成 本 邻接 和 矩阵 ， 画 出 该 加 权 图 的 邻接 数组 。 
31. 对 图 16-13b 和 16-13c 的 成 本 邻接 和 矩阵 ， 画 出 该 加 权 图 的 邻接 链表 。 


16.7 类 实现 
16.7.1 不 同 的 类 


一 共有 4 种 图 : 无 权 无 向 图 、 加 权 无 向 图 、 无 权 有 向 图 和 加 权 有 向 图 ， 在 16.5 节 和 16.6 
节 中 ， 对 每 一 个 图 ， 我们 都 考虑 三 种 描述 方法 : 邻接 矩阵 、 邻 接 链表 和 邻接 数组 。 对 每 一 种 
图 的 每 一 种 描述 ， 都 有 一 个 C++ 类 与 之 对 应 ， 一 共 12 个 类 。 本 书 只 考虑 8 个 类 。 与 邻接 数 
组 对 应 的 4 个 类 留 作 练习 37 至 练习 40。 

本 节 要 讨论 的 8 个 类 是 : adjacencyGraph ( 用 和 矩阵 描述 的 无 权 无 向 图 )、adjacencyWGraph、 
adjacencyDigraph、adjacencyWDigraph、linkedGraph、linkedWGraph、linkedDigraph 和 
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linkedWDigraph。 

在 4 种 图 中 ， 有 若干 对 之 间 存 在 IsA 关系 。 例 如 ， 无 向 图 可 以 看 作 “ 若 边 (j,i) 存在 ， 则 
边 (i,7) 也 存在 ”的 有 向 图 ; 也 可 以 看 做 所 有 边 的 权 均 为 1 的 加 权 无 向 图 ; 也 可 以 看 做 所 有 边 
的 权 为 1， 而 且 “ 若 边 (ij ) 存在 ， 则 边 (j,i) 也 存在 ”的 加 权 有 向 图 。 类 似 的 ， 有 向 图 也 可 
以 看 做 所 有 边 的 权 均 为 1 的 加 权 有 向 图 。 

利用 这 些 关系 可 以 很 容易 地 设计 这 8 个 类 ， 因 为 可 以 从 一 个 类 派生 出 另 一 个 类 。 虽 
然 存在 很 多 IsA 关系 ， 但 我 们 只 能 利用 少数 的 几 个 关系 。 图 16-15 显示 了 我 们 使 用 的 派生 
层次 。 例 如 ， 类 adjacencyGraph 从 类 adjacencyWGraph 派生， 类 adjacencyWGraph 从 类 
adjacencyWDigraph 派生 。 抽 象 类 graph 是 所 有 类 的 超 类 。 这 个 类 包含 了 独立 实现 的 方法 。 这 
些 独 立 实 现 的 方法 被 所 有 图 类 继承 。 








图 16-15 类 的 派生 层次 


16.7.2 ”邻接 矩阵 类 


加 权 边 的 邻接 矩阵 类 与 无 权 边 的 邻接 矩阵 类 是 相似 的 。 主 要 的 区 别 是 ， 加 权 边 的 类 使 用 
的 是 一 个 类 型 为 了 的 二 维 数组 ， 其 中 TT 是 权 的 类 型 ， 而 无 权 边 的 类 使 用 的 是 一 个 类 型 为 bool 
的 二 维 数组 。 我 们 只 描述 加 权 图 类 adjacencyWDigraph 和 adjacencyWGrahp。 虽 然 本 书 只 有 类 
adjacencyWDigraph 的 代码 ， 但 是 你 可 以 从 本 书 网 站 上 得 到 所 有 邻接 矩阵 类 的 代码 。 

1. 类 adjacencyWDigraph 

程序 16-2 是 类 adjacencyWDigraph 的 代码 。 


程序 16-2 ”加 权 有 向 图 的 成 本 邻接 矩阵 
template <class T> 
class adjacencyWDigraph : public graph<T> 
{ 


Protected: 
int n; 1/ 顶点 个 数 
int e; 1/ 边 的 个 数 
T **as // 邻接 数组 
T noEdge; 1/ 表示 不 存 的 边 
public: 
adjacencyWDigraph (int numberOfVertices = 0, T theNoEdge = 0) 
{// 构造 函数 
1/ 确认 顶点 数 的 合法 性 


if (numberOfVertices < 0) 

throw illegalParameterValue ("number of vertices must be >= 0"): 
n = numberOfVertices; 

已 = 一 0; 
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noEdge = theNoEdge; 
make2dArray(a, n+ 1, n+ 1); 
fr (inE i 1 1 eS 1 EF) 
1/ 初始 化 邻接 矩阵 
fill(a[li], a[li] + n + 1, noEdge); 


~adjacencyWDigraph() {delete2dArrayl(la, n + 1);} 
int numberOfVertices() const {return n;} 
int numberOfEdges() const {return e;]} 
bool directed() const {return true;} 
bool weighted() const {return 七 TUe7 |} 
bool existsEdge (int i, int j) const 
{// 返回 值 是 真 ， 当 且 仅 当 (i,j) 是 图 的 一 条 边 
3 让 站 计 交 1 Sn 1| 3 nm [| atilli == nondogey 
return false; 
else 
return true; 


void insertEdge (edge<T> *theEdge) 
{1/ 插 入 边 ; 如 果 该 边 已 经 存在 ， 则 用 theEdge->weight () 修改 边 的 权 
int vi = theEdge->vertexl ()， 
int v2 = theEdge->vertex2(); 
1 2 > 1 ==: 2) 
{ 
ostringstream S7 
S < TE we TL RE i RK TT 
<< ") is not a permissible edge"; 
throw illegalParameterValue(s.str()); 


} 


if (a[vl] [v2] == nogdge) // 新 的 边 
人 十 十 了 
al[lvl] [v2] = theEdge->weight () 7 


void eraseEdge (int i, int j) 
{/ 删除 边 (i,j) 
if (i >= 1 && jj >= 1 g&& i <=n && jj <= n && ali][j] != noEdge) 
{ 
a[il[j] = nokEdge; 


Ci 


void checkVertex (int theVertex) const 
{1/ 确认 是 有 效 顶 点 
if (theVertex < 1 || theVertex > n) 
{ 
ostringstream s; 
S << "no vertex " << theVertex; 
throw illegalParameterValue(s.str()); 
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int aegree (1int theVertex) const 
{throw undef inedMethod("aegree () undef ined");} 


int outDegree (int theVertex) const 
{/ 返回 顶点 theVertex 的 出 度 


checkVertex (theVertex) : 


/1/ 计数 关联 于 顶点 theVertex 的 边 数 


int sum = 0; 


for ‘(in J 二 2} 可 = nr jt) 
if (a[ltheVertex] [jl != noEdge) 
Sum++?} 


return sum; 


int inDegree (int theVertex) const 
{// 返回 顶点 theVertex 的 入 度 


checkVertex (theVertex); 


// 计数 关联 至 顶点 theVertex 的 边 数 


int sum = 0; 
for (int TI Li 3 = ny j++) 
if (a[j] [theVertex] != noEdge) 
sumt++? 


return sum; 


class myIterator : public vertexIterator<T> 
{ 
Public: 
myIterator (T* theRow, T theNoEdge, int numberOfVertices) 
{ 
row = theRow; 
noEdge = theNoEdge; 
n = numberOfVertices; 
currentVertex = 1; 


~myIterator() {} 


int next (T& theWeight) 
{// 返回 下 一 个 顶点 。 若 不 存在 ， 则 返回 0 
// 赋 权 值 theWeight = 边 的 权 值 
1/ 寻找 下 一 个 邻接 的 顶点 
for (int j = currentVertex; j <= n; j++) 
if (row[j] != noEdge) 
{ 
currentVertex =j + 1; 
theWeight = row[j]; 
return 可: 
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/不 存在 下 一 个 邻接 的 顶点 
currentVertex = mn + 1} 
return 0; 

} 

1//next () 的 代码 与 上 面 类 似 


protected: 


T* row; // 邻接 矩阵 的 行 
T noEdge; /theRow[i] == nogdge， 当 且 仅 当 没 有 关联 于 顶点 工 的 边 
int ny // 顶点 数 


int currentVertex; 


}; 


myIterator* Iterator (Int theVertex) 
{// 返回 项 点 theVertex 的 迭代 器 
checkVertex (theVertex); 
return new myIterator(altheVertex], noEdge, n); 
} 
}; 


构造 函数 创建 了 一 个 加 权 有 向 图 的 成 本 邻接 矩阵 ， 节 点 数 n=numberOfVertices， 边 数 为 
e。 二 维 数组 a 的 所 有 元 素 初始 化 为 noEdge，e 的 初始 值 为 0。 因 此 ， 构造 函数 的 时 间 复 杂 性 
为 O(n”)。 

方法 insertEdge 首先 要 确证 输入 边 theEdge 的 端点 属于 [1,n]， 而 且 不 同 ， 即 边 的 端点 对 
应 的 是 加 权 有 向 图 的 顶点， 边 不 是 自 连 边 。 如 果 边 theEdge 没有 通过 这 种 检验 ， 就 抛 出 一 个 
类 型 为 illegalParameterValue 的 异常 。 如 果 通 过 检验 ， 还 必须 检验 该 边 是 否 在 图 中 存在 。 如 果 
已 经 存在 ， 就 要 更 新 该 边 的 权 ， 而且 边 数 不 增加 。 如 果 不 存在 ， 就 要 把 该 边 的 权 赋 值 在 a 中 ， 
然后 边 数 增 1。 

方法 eraseEdge 首先 确认 要 删除 的 边 在 图 中 存在 。 如 果 该 边 存 在 ， 那 么 a 的 相应 元 素 就 被 
赋值 aoEdge， 而 且 边 数 减 1。 

方法 degree 仅仅 抛 出 一 个 类 型 为 undefinedMethod 的 异常 ， 因 为 degree 仅 是 对 无 向 图 
(不 管 是 否 加 权 ) 定义 的 。 顶 点 theVertex 的 出 度 通过 计算 在 a[theVertex][*] 中 不 等 于 noEdge 
的 元 素数 量 来 得 到 。 顶 点 theVertex 的 人 度 是 在 a[*][theVertex] 中 不 等 于 noEdge 的 元 素数 量 。 

对 迭代 器 ， 我 们 定义 了 类 mylIterator， 它 是 adjacencyWDigraph 的 成 员 类 。 在 抽象 类 
graph ( 16.4 节 ) 中 我 们 讨论 过 ， 适 代 融 一 个 一 个 地 返回 邻接 于 正在 被 访问 的 项 点 的 顶点。 代 
码 next 在 当前 被 访问 的 顶点 所 在 的 行 ， 从 当前 位 置 currentVertex 开始 扫描 ， 寻 找 第 一 个 不 等 
于 noEdge 的 项 。 如 果 这 一 项 存在 ， 它 返回 一 对 数值 : 列 的 索引 ( 即 相 邻 的 顶点 ) 和 边 的 权 
(前 者 是 以 函数 返回 值 返回 ， 后 者 以 函数 引用 参数 返回 一 一 译 者 注 )。 如 果 这 一 项 不 存在 ， 则 
返回 0。 

方法 existsEdge、numberOfVertices、numberOfEdges、directed、weighted、insertEdge、eraseEdge、 
degree 和 iterator 的 时 间 复 杂 性 是 6(1)。 方 法 outDegree、inDegree 和 next 的 时 间 复 杂 性 是 
O(n)。 如 果 用 一 个 数组 来 记录 出 度 和 入 度 的 值 ， 那 么 outDegree 和 inDegree 的 时 间 复 杂 性 可 以 
降 到 @(1) 

2. 类 adjacencyWGraph 

这 个 类 派生 于 类 adjacencyWDigraph， 它 继承 了 超 类 的 所 有 数据 成 员 方法 。 我 们 需要 重 载 
那些 内 容 不 同 的 方法 。 方 法 insertEdge 必须 把 边 theEdge 的 权 赋 给 a[v1][v2] 和 a[v2][v1]。 方 
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法 eraseEdge 必须 把 边 noEdge 赋 给 a[i][j] 和 a[j][ 让 。 方 法 degree 必须 定义 ， 而 且 返 回 值 是 在 
a[theVertex][*] 中 不 等 于 noEdge 的 元 素数 量 方法 directed 的 返回 值 应 为 false。 重 载 方 法 的 代 
码 与 adjacencyWDigraph 的 相应 代码 很 相似 。 本 书 没有 包含 这 些 代码 ， 不 过 可 以 从 本 书 网 站 
上 得 到 。 


16.7.3 扩充 chain 类 


在 一 个 图 的 链表 描述 中 ， 我 们 使 用 了 一 个 链表 数组 。 为 了 应 用 ， 我 们 在 类 chain ( 见 6.1 
节 ) 的 方法 中 增加 了 eraseElement(theVertex)。 这 个 方法 搜索 链表 ， 查 找 顶 点 等 于 theVertex 的 
元 素 。 如 果 找 到 ， 则 删除 这 个 元 素 ， 并 返回 这 个 元 素 的 指针 。 扩 展 后 的 链表 为 graphChain。 


16.7.4 ”链表 类 


程序 16-3 给 出 了 类 linkedDigraph 的 数据 成 员 和 一 些 方法 。 构 造 函数 的 时 间 复 杂 性 是 
O(n)， 其 中 n=numberOfVertices。 方 法 existsEdge(i,j) 的 时 间 复 杂 性 是 O(d™™))。 


程序 16-3 类 linkedDigraph 
class linkedDigraph : public graph<bool> 
{ 





protected:; 
int ny / 顶点 数 
int e; 1/ 边 数 
graphChain<int> *aList; 1/ 邻接 表 
public: 
linkedDigraph (int numberOfVertices = 0) 
{/W 构造 函数 


if (numberOfVertices < 0) 
throw illegalParameterValue 
("number of vertices must be >= 0") 
n = numberOfVertices; 


e= 0; 

aList = new graphChain<int> [n+ 1]; 
} 
~linkedDigraph() {delete [] aLlList;} 


1 关于 numberOfVertics,numberOfEdges,directed 和 weighted 的 代码 
/1 与 adjacencyDiagraphino 相同 
bool existsEdge (int i, int j) const 


{// 返回 上 true， 当 且 仅 当 (i,j) 是 一 条 边 


下 二 有 下 人 洒 芝 二 小 泛称 二 1 要 全 肌 
11 aList[il.indexof(j) == -1) 
return false; 
else 


return true’ 


} 


void insertEdge (edge<bool> *theEdge) 
{插入 一 条 边 
1/ 设置 Vi 和 V2， 并 检验 其 合法 性 ， 此 处 代码 与 adjacencyDigraphino 相同 


if (aList[vil].indexOf (v2) == -1) 
{1/ 新 边 
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aList[vl].insert (0, v2); 
e++; 


} 


void eraseEdge (int i, int j) 
{ 
if (i.>= 1T8&&Jj >= 1 8&8&1i<=nmng&&]j <= n) 
{ 
int *v = aList[i] .eraseElement (j); 
if (v != NULL) /和 边 (i,j) 存在 
已 一 一 


} 


void checkVertex(int theVertex) const 
{// 检验 theVertex 是 否 是 有 效 顶点 

1/ 此 处 代码 与 adjacecyDigraphino 相同 
} 


int degree (int theVertex) const 
{throw undef inedMethod ("degree() undef ined");} 


int outDegree (int theVertex) const 
{W 返回 顶点 theVertex 的 出 度 
checkVertex (theVertex); 
return aList[theVertex] .size(); 


int inDegree (int theVertex) const 


{ 
checkVertex (theVertex); 


// 计数 顶点 上 theVertex 的 入 边 


int sum = 0; 
for (int j = 1; j <= n; j++) 
if (aList[j].indexOf (theVertex) != -1) 
Sumt++; 


return sum; 


} 


1/ 迭代 器 代码 省 略 
Ps 


要 在 有 向 图 中 插入 一 个 边 (vl,v2)， 首 先 要 确定 这 个 边 在 图 中 不 存在 ， 然 后 把 v2 插 
到 链表 aList[lvl] 之 前 。 要 删除 边 (i,j) 我 们 用 方法 graphChain::eraseElement 从 链表 
aList[i] 中 删除 j。 方 法 insertEdge 的 时 间 复 杂 性 是 0(4 汐 ， 方 法 eraseEdge 的 时 间 复 杂 性 是 
O(d?™ )。 

方法 degree 对 有 向 图 没有 定义 。 顶 点 theVertex 的 出 度 正 是 aList[theVertex].listSize()。 
因为 chain::listSize( 的 时 间 复 杂 性 是 @(1)， 所 以 一 个 顶点 的 出 度 可 以 在 时 间 8(1) 内 确 
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定 。 计 算 一 个 顶点 的 入 度 要 用 时 多 得 多 。 为 了 计算 顶点 theVertex 的 入 度 ， 必 须 搜索 所 有 
邻接 表 ， 记 录 包 含 顶点 theVertex 的 表 的 数量 (程序 16-3 )。 方 法 inDegree 的 时 间 复 杂 性 是 
O(n+e)， 其 中 4 和 ee 分别 是 顶点 数 和 边 数 。 如 果 用 一 个 数组 来 记录 入 度 ， 那 么 时 间 复 杂 性 可 
以 降 到 8@(1)。 

其 他 链表 类 

其 他 链表 类 的 代码 不 难 编写 ， 也 可 以 从 本 书 网 站 得 到 。 


练习 


32. 编写 方法 adjacencyWDigraph::input， 它 输入 一 个 加 权 有 向 图 。 假 设 输入 数据 由 顶点 个 数 、 
边 的 个 数 和 边 的 列表 构成 。 每 一 条 边 都 是 一 对 顶点 和 边 上 的 权 。 注 意 ， 输 入 方法 是 从 邻接 
和 矩阵 类 继承 的 。 你 的 输入 方法 对 邻接 矩阵 类 是 否 正确 ? 如果 不 正确 ， 编 写 新 方法 来 覆盖 它 。 

33. 编写 和 测试 类 adjacencyWDigraph 的 复制 构造 函数 。 

34. 编写 方法 linkedDigraph::input， 它 输入 一 个 有 向 图 。 时 间 复 杂 性 应 该 是 顶点 数 和 边 数 的 线 
性 函数 。 证 明 是 这 样 一 个 结果 。 

35. 编写 方法 linkedWDigraph::input， 它 输入 一 个 加 权 有 向 图 。 时 间 复 杂 性 应 该 是 顶点 数 和 边 
数 的 线性 函数 。 证 明 是 这 样 一 个 结果 。 

36. 如 果 在 类 graphChain 中 包含 方法 indexOf 的 一 个 新 版 本 ， 我 们 就 能 提高 类 linkedWGraph 
和 linkedWDigraph 的 时 间 性 能 。 这 个 新 版 本 用 来 更 新 已 经 存在 的 元 素 。 开 发 这 样 的 
indexOf 方法 ， 而 且 利 用 它 修改 邻接 链表 类 的 insertEdge 方法 。 

37. 开发 C++ 类 arrayDigraph， 用 邻接 数组 描述 有 向 图 。 

38. 开发 C++ 类 arrayGraph， 用 邻接 数组 描述 无 向 图 。 

39. 开发 C++ 类 arrayWDigraph， 用 邻接 数组 描述 加 权 有 向 图 。 

40. 开发 C++ 类 arrayWGraph， 用 邻接 数组 描述 加 权 无 向 图 。 


16.8 图 的 遍历 


图 的 算法 很 多 ， 难 以 尽数 。 在 16.2 节 , 已 经 介绍 了 一 些 算法 ( 例如 ， 寻 找 路 径 、 寻 找 生 
成 树 ， 判 断 一 个 向 图 是 否 是 连通 的 )， 下 面 我 们 介绍 其 他 算法 。 很 多 算法 需要 从 一 个 已 知 的 顶 
点 开始 ， 搜 索 所 有 可 以 到 达 的 顶点 。 所 谓 顶 点 4 是 从 顶点 v 可 到 达 的 ， 是 指 有 一 条 从 顶点 v 
到 顶点 u 的 路 径 。 这 种 搜索 有 两 种 常用 的 方法 : 广度 优先 搜索 ( breadth first search，BFS ) 和 
深度 优先 搜索 ( depth first search，DFS )。 不过， 要 获得 效率 更 高 的 图 的 算法 ， 深 度 优 先 搜索 
方法 使 用 得 更 多 。 


16.8.1 广度 优先 搜索 


考察 图 16-16a 的 有 向 图 。 要 搜索 从 顶点 1 开始 可 到 达 的 所 有 顶点 ,一 种 方法 是 ， 首 
先 确定 邻接 于 顶点 1 的 顶点 集合 ， 这 个 集合 是 {2,3,4}。 然 后 确定 邻接 于 {2,3,4} 的 新 的 
顶点 集合 ( 即 还 没有 到 达 过 的 )， 这 个 集合 是 {5,6,7}。 邻 接 于 {5,6,7} 的 新 的 顶点 集合 为 
{8,9}。 而 不 存在 邻接 于 {8,9} 的 顶点 。 因 此， 从 顶点 1 开始 搜索 ， 可 以 到 达 的 顶点 集合 为 
{1,2,3,4,5,6,7,8,9}。 
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图 16-16 广度 优先 搜索 


这 种 从 一 个 顶点 开始 ， 搜 索 所 有 可 到 达 顶 点 的 方法 叫做 广度 优先 搜索 。 这 种 搜索 方法 可 
使 用 队列 实现 ， 图 16-17 给 出 了 一 种 实现 的 伪 代 码 。 注 意 ， 图 的 BFS 和 二 又 树 的 层次 遍历 是 
相似 的 。 

如 果 用 图 16-17 的 伪 代 码 广度 优先 搜索 图 16-16a， | PreadthFirstSearchQ) 
生起 始 项 点 =1， 则 在 外 层 while 循 环 的 第 一 次 迭代 |“ Labpel vertex vas teached 
中 ， 顶 点 2,3,4 被 依次 加 入 队列 中 。 在 第 二 次 迭代 Initialize Q to be a queue with only v in it. 


中 ， 从 队列 中 删除 顶点 2， 加 入 顶点 5; 然后 从 队列 人 





中 删除 项 点 3， 但 是 没有 加 入 新 顶点 ; 从 队列 中 删 Delete a vertex W from the queue. 

除 项 点 4， 加 入 顶点 6 和 7; 从 队列 中 删除 项 点 5， et Aavent rom w: 

加 入 顶点 8; 从 队列 中 删除 项 点 6， 但 是 没有 加 入 新 { 

顶点 ; 从 队列 中 删除 顶点 7， 加 入 项 点 9， 最 后 从 队 if(u has not been labeled) 

列 中 删除 顶点 8 和 9， 队 列 成 空 。 过 程 终止 时 ， 顶 ee 

点 1 到 9 被 加 上 已 到 达标 记 。 图 16-16b 给 出 了 在 广 Label u as reached. 

度 搜索 过 程 中 所 经 历 的 边 。 we vertex that is adjacent from w. 
定理 16-1 设 G 是 一 个 任意 类 型 的 图 , Vv 是 G 

的 任 一 顶点 。 图 16-17 的 伪 代 码 能 够 标记 从 Vv 出 发 } 

可 以 到 达 的 所 有 顶点 ( 包括 顶点 v)。 国 
证 明 这 个 定理 的 证 明 留 做 练习 43 第 1 ) 题 。 图 16-17 BFS 的 伪 代 码 


16.8.2 ”广度 优先 搜索 的 实现 


如 图 16-17 伪 代 码 所 示 ，BFS 方法 要 具有 恰当 的 高 度 ， 就 应 该 独立 于 图 的 类 型 和 图 的 描 

述 方法 。 然 后 ， 要 实现 下 面 的 语句 
WU= 邻接 于 w 的 下 一 个 顶点 

我 们 需要 知道 实现 的 代码 。 使 BFS 方法 成 为 超 类 graph 的 成 员 ， 使 用 graph 的 迭代 器 来 实现 
邻接 顶点 的 搜索 ， 这 样 可 以 使 我 们 不 必 为 每 一 个 图 的 实现 单独 地 编写 BFS 代码 。 

独立 实现 的 BFS 代码 ( 见 程序 16-4 ) 与 图 16-17 的 伪 代 码 联系 非常 紧密 。 程 序 16-4 在 初 
始 时 ， 对 于 所 有 顶点 都 有 reach[i]=0 并 且 lable 关 0。 在 算法 终止 时 ， 所 有 可 到 达 顶 点 都 把 对 
应 的 reach[i 设置 成 label。 


程序 16-4 BFS 代码 
virtual void bfs(int v, int reach[], int label) 
{1/ 广度 优先 搜索 。reach[i] 用 来 标记 从 顶点 v 可 到 达 的 所 有 顶点 
arrayQueue<int> gq(10); 
reach[v] = label; 
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q.push(v); 

while (!q.empty()) 

{ 
/ 从 队列 中 删除 一 个 标记 过 的 顶点 
int WwW = .front()? 
q:Pop(); 


1 标记 所 有 没有 到 达 的 邻接 于 顶点 w 的 顶点 
vertexIterator<T> *iw = iterator (w); 
int u; 
while ((u = iw->next()) != 0) 
/访问 顶点 w 的 一 个 相 邻 顶点 
if (reach[u] == 0) 
{1/u 是 一 个 没有 到 达 过 的 顶点 
G.Push (u); 
reach[ul = label; /做 到 达标 记 
} 
delete jiw; 


16.8.3 ”方法 graph::bfs 的 复杂 性 分 析 


每 一 个 从 起 始 项 点 v 出 发 可 到 达 的 顶点 都 被 加 上 标记 ,加 入 队列 只 一 次 ， 从 队列 中 删除 
只 一 次 ， 而 且 它 所 在 的 邻接 矩阵 或 邻接 链表 的 行 也 只 遍历 一 次 。 如 果 有 s 个 顶点 被 标记 ， 那 
么 当 使 用 邻接 矩阵 时 ， 这 些 操作 所 需要 的 时 间 为 O(sn)， 而 使 用 邻接 链表 时 ， 所 需 时 间 为 


0( 之 信 ) ， 其 中 ;表示 被 标记 的 顶点 i。 对 于 无 向 图 ， 顶 点 的 出 度 就 等 于 它 的 度 。 


现在 我 们 想 知道 ， 与 每 一 种 描述 都 定制 一 个 BFS 代码 相 比 ， 统 一 的 BFS 代码 的 复 
杂 性 是 多 少 ? 我 们 需要 三 种 定制 的 代码 : 一 个 是 adjacencyWDigraph 的 成 员 ， 第 二 个 是 
linkedWDigraph 的 成 员 ， 第 三 个 是 linkedDigraph 的 成 员 。 其 余 的 方法 从 超 类 中 继承 这 些 定制 
的 代码 。 程 序 16-5 和 程序 16-6 分 别 adjacencyWDigraph 和 linkedDigraph 定制 的 代码 。 


程序 16-5 为 adjacencyWDigraph 直接 定制 的 BFS 代码 


void bfs(int v, int reach[], int label) 
{W 广度 优先 搜索 。reach[i] 用 来 标记 所 有 邻接 于 顶点 v 的 可 到 达 的 顶点 
arrayQueue<int> gq(10); 
reach[v] = label; 
q.push (v); 
while (!gq.empty()) 
{ 
1// 从 队列 中 删除 一 个 有 标记 的 顶点 
int w = q.front(); 
q.pop(); 


1/ 标记 所 有 邻接 于 顶点 w 的 还 没有 到 达 的 顶点 


£0F (int t= 1 VW <= Bl ut++) 
/访问 顶点 w 的 一 个 关联 的 顶点 
if (a[w] [u] != noEdge && reach[ul == 0) 


{Wu 是 一 个 没有 到 达 的 顶点 
q.push (ua) ， 
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reach[u] = label; /做 到 达标 记 


程序 16-6 ”为 linkedDigraph 直接 定制 的 BFS 代码 


void bfs (int v, int reach[], int label) 
{1/ 广度 优先 搜索 。reach [i] 用 来 标记 所 有 邻接 于 顶点 的 可 到 达 的 顶点 
arrayQueue<int> q(10);，; 
reach[v] = label; 
q.push(v); 
while (!q.empty()) 


1/ 从 队列 中 删除 一 个 有 标记 的 顶点 
int w = q.front(); 
q.pop(); 


1/ 标 记 所 有 邻接 于 顶点 w 的 还 没有 到 达 的 顶点 
for (chainNode<int>* u = aList[w] .firstNode; 
u != NULL; u = UU->next) 
/访问 顶点 w 的 一 个 关联 的 顶点 
if (reach[u->element] == 0) 
{//u->element 是 一 个 没有 到 达 的 顶点 
dq.push(u->element); 
reach [u->element] = label; /做 到 达标 记 
} 


} 


在 1.7GHz 的 奔腾 4 PC 上， 对 100 个 顶点 的 无 权 完 全 无 向 图 ， 用 邻接 矩阵 描述 时 ， 
graph::bfs 用 时 0.18 毫秒 。adjacencyWDigraph::bfs 用 时 0.06 上 毫秒。 在 时 间 性 能 上 ， 统 一 实现 
的 代码 graph::bfs 是 定制 代码 的 3 倍 。 对 邻接 链表 的 描述 来 说 ， 独 立 的 统一 代码 的 执行 时 间 为 
1.0 毫秒 ， 定 制 的 代码 是 0.9 毫秒 。 前 者 比 后 者 多 了 11%。 

我 们 看 到 ， 使 用 独立 BFS 代码 ， 而 不 是 定制 的 代码 ， 是 有 性 能 损失 的 。 在 邻接 矩阵 描述 
中 ， 这 种 损失 会 很 大 ， 主 要 是 因为 使 用 迭代 器 。 然 而 要 记 住 ， 使 用 独立 的 代码 有 若干 优点 。 
例如 ， 一 份 代码 即 可 满足 所 有 的 图 类 描述 ， 而 定制 代码 需要 若干 个 。 因 此 ， 如 果 我 们 引进 新 
的 描述 方法 ( 例如 邻接 数组 表 )， 就 可 以 不 加 修改 地 使 用 独立 的 代码 。 当 我 们 要 开发 一 个 新 的 
图 应 用 程序 ， 我 们 可 以 首先 开发 独立 的 代码 。 这 个 方法 使 所 有 应 用 实现 使 用 这 个 代码 。 然 后 ， 
如 果 时 间 和 资源 允许 ， 我 们 就 可 以 定制 更 有 效率 的 代码 。 


16.8.4 深度 优先 搜索 
depthFirstSearch(v) 


深度 优先 搜索 是 男 一 种 搜索 方法 。 在 8.5.6 节 { 
的 老鼠 钻 迷 宫 问 题 中 已 经 使 用 了 这 种 方法 ， 而且 Label vertex Vv as reached. 


for(each unreached vertex U adjacent from V) 


它 与 二 又 树 的 前 序 遍 历 很 相似 。 depthFirstSearch(u); 
图 16-18 是 DFS 的 伪 码 。 从 一 个 顶点 v 出 发 ， } 
DFS 按 如 下 过 程 进行 : 首先 将 v 标 记 为 已 到 达 的 





顶点 ， 然 后 选择 一 个 邻接 于 v 的 尚未 到 达 的 顶点 轩 048 DPS 的 人 代表 
u。 如 果 这 样 的 w 不 存在 ， 则 搜索 终止 。 假 设 这 样 的 w 存在， 那么 从 w 又 开始 一 个 新 的 DFS。 
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当 这 种 搜索 结束 时 ， 再 选择 另外 一 个 邻接 于 v 的 尚未 到 达 的 顶点 。 如 果 这 样 的 顶点 不 存在 ， 
那么 搜索 终止 。 如 果 这 样 的 顶点 存在 ， 又 从 这 个 顶点 开始 进行 DFS， 如 此 继续 下 去 。 

让 我 们 对 图 16-16a 的 有 向 图 来 应 用 depthFirstSearch。 如 果 v=1， 那 么 顶点 2、3 和 4 成 
为 u 的 候选 。 假 设 选择 顶点 2， 那么 从 顶点 2 开始 DFS。 将 项 点 2 标记 为 已 到 达 顶 点 。 这 时 
u 的 候选 只 有 顶点 5， 然后 从 5 开始 DFS。 将 项 点 5 标记 为 已 到 达 顶 点 ， 然 后 从 顶点 8 开始 
DFS。 将 顶点 8 加 上 标记 。 而 从 顶点 8 开始 没有 不 可 到 达 的 邻接 顶点 ， 因 此 返回 到 顶点 5。 顶 
点 5 也 没有 新 的 可 到 达 的 邻接 顶点 ， 再 返回 到 顶点 2， 然 后 返回 到 顶点 1。 

在 顶点 1， 还 有 两 个 候选 顶点 : 3 和 4。 假设 选中 顶点 。 从 顶点 4 开始 DFS， 将 顶点 4 标 
记 为 已 到 达 顶 点 。 现 在 ， 顶 点 3、6 和 7 都 成 为 候选 项 点 。 假 设 选中 顶点 6， 这 时 顶点 3 是 唯 
一 的 候选 。 从 顶点 3 开始 DFS， 并 将 它 标记 为 已 到 达 顶 点 。 因 为 没有 邻接 于 3 的 新 顶点 ， 所 
以 返回 到 顶点 6。 因 为 没有 邻接 于 6 的 新 顶点， 所 以 返回 顶点 4， 这 时 项 点 7 成 为 新 的 候选 。 
从 7 开始 DFS。 然 后 到 达 顶 点 9， 而 没有 邻接 于 9 的 顶点 。 这 一 次 ， 我 们 最 终 反 回 到 顶点 1， 
而 没有 邻接 于 1 的 新 顶点 ， 因 此 算法 终止 。 

对 于 算法 depthFirstSearch， 我 们 可 以 证 明 一 个 定理 ， 它 与 定理 16-1 类 似 。 算 法 
depthFirstSearch 可 以 标记 顶点 v 和 所 有 从 vv 可 以 到 达 的 顶点 ( 见 练习 43 第 2) 题 )。 

定理 16-2 设 G 是 一 个 任意 类 型 的 图 ，v 是 G 的 任意 一 个 顶点 。depthFirstSearch 可 以 标 
记 所 有 从 vv 可 以 到 达 的 顶点 ( 包括 v)。 

证 明 这 个 定理 的 证 明 留 做 练习 43 第 2 ) 题 。 回 


16.8.5 深度 优先 搜索 的 实现 


程序 16-7 是 公有 方法 graph::dfs 以 及 保护 方法 graph::rDfs 的 代码 。 它 假设 graph<T>::reach 
和 graph<T>::label 是 类 graph 的 静态 数据 成 员 。 在 实现 DFS 中 , 令 u 遍历 所 有 邻接 于 v 的 顶点 
比 仅 仅 遍 历 不 邻接 于 v 的 顶点 ， 其 代码 更 容易 。 


程序 16-7 深度 优先 搜索 
void dfs(int v, int reach [], int label) 
{V 深度 优先 搜索 。reach [i] 用 来 标记 所 有 邻接 于 顶点 v 的 可 到 达 的 顶点 
graph<T>::reach = reach; 
graph<T>::label = label; 
rDfs (v); 
} 


void rpDfs(int v) 
{V 深度 优先 搜索 递归 方法 
reach[v] = label,; 
vertexIterator<T> *iv = iterator(v); 
int us 
while ((u = iv->next()) != 0) 
/访问 与 v 相 邻 的 顶点 
If (reach[u] == 0) 
rDfs(u); /Wu 是 一 个 没有 到 达 的 顶点 


delete iv; 
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16.8.6 方法 graph::dfs 的 复杂 性 分 析 


可 以 验证 dfs 和 bfs 有 相同 的 时 间 和 空间 复杂 性 。 不 过 ， 使 dfs 占用 空间 最 大 (递归 栈 空 
间 ) 的 实例 却 是 使 bfs 占用 空间 最 小 ( 队列 空间 ) 的 实例 ， 而 使 bfs 占用 空间 最 大 的 实例 却 是 
使 dfs 占用 空间 最 小 的 实例 。 图 16-19 给 出 了 dfs 和 bfs 的 性 能 在 最 好 和 最 坏 情 况 下 的 实例 。 


(LD 
("0 DO 0D 


a) dfs(1) 的 最 坏 情 况 ; bfs(1) 的 最 好 情况 b) dfs(1) 的 最 好 情况 ; bfs(1) 的 最 坏 情况 
图 16-19 产生 最 好 和 最 坏 空间 复杂 性 的 图 例 


练习 


41. 考虑 图 16-4a 的 图 。 
pa 
) 按 序 标记 从 顶点 4 开始 的 BFS 中 的 顶点 。 使 用 1 ) 的 描述 和 程序 16-4 的 代码 。 
) 画 出 在 2 ) 中 由 通 向 新 顶点 的 边 所 构成 的 子 图 。 
4 重 做 2) 和 3 )， 不 过 是 用 程序 16-7 的 代码 进行 DFS。 
42. 用 项 点 7 作为 搜索 的 起 始 顶 点 ， 完 成 练习 41。 
43. 1 ) 证 明定 理 16-1。 
2 ) 证 明定 理 16-2。 
44. 为 类 adjacencyWDigraph 和 linkedDigraph 编写 定制 的 DFS。 
1 ) 测试 你 的 代码 。 
2 ) 对 100 个 顶点 的 完全 有 向 图 ， 定 制 的 代码 比 程序 16-7 的 独立 实现 代码 提高 了 多 少时 间 
性 能 ? 


16.9 ”应 用 
16.9.1 寻找 一 条 路 径 


用 广度 优先 搜索 或 深度 优先 搜索 ， 寻 找 一 条 从 源 点 theSource 到 终点 theDestination 的 路 
径 ( 见 例 16-1 )， 搜 索 从 顶点 theSource 开始 ， 到 达 顶 点 theDestination 结束 。 要 实际 地 得 到 
这 条 路 径 ， 需 要 记 住 从 一 个 顶点 到 下 一 个 顶点 的 边 。 在 深度 优先 搜索 中 ， 路 径 的 边 集 已 隐 含 
在 递归 过 程 中 ， 因 此 利用 深度 优先 策略 设计 一 个 寻找 路 径 的 程序 是 比较 容易 的 。 在 完成 顶点 
theDestination 的 标记 之 后 ， 把 递归 过 程 扩 展 ， 可 以 反 向 建立 起 从 theDestination 到 theSource 
的 路 径 。 程 序 16-8 是 方法 graph::findPath 的 代码 。 程 序 16-9 是 方法 graph::rFindPath 的 代码 。 

如 果 从 顶点 theSource 到 顶点 theDestination 不 存在 路 径 ， 那 么 findPath 的 返回 值 是 
NULL ; 否则 ,返回 值 是 一 个 数组 path， 其 中 path[0] 是 路 径 的 边 数 ; path[1]=theSource… 
path[path[0]+1]=theDestination 是 路 径 。 


程序 16-8 ”在 图 中 寻找 一 条 路 径 的 前 序 方法 
int* findPath(int theSource, int theDestination) 
{// 寻找 一 条 从 顶点 theSource 到 顶点 theDestination 的 路 径 
/返回 一 个 数组 path， 从 索引 1 开始 表示 路 径 。path[0] 表示 路 径 长 度 
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// 如 果 路 径 不 存在 ， 返 回 NULL 
// 为 寻找 路 径 的 递归 算法 初始 化 


int n = numberOfVertices(); 


path = new int [fn + 1]; 
path[1] = theSource; /第 一 个 顶点 总 是 
length = 1; 1/ 当前 路 径 长 度 + 1 
destination = theDestination; 
reach = new int [n+ 1]; 
for ‘(int 4 = 1 1 <=: Ni +t*) 
reach[i] = 0; 
1/ 搜索 路 径 
if (theSource == theDestination || rFindPath (theSource)) 
1/ 找到 一 条 路 径 
path[0] = length - 1 
else 
{ 
delete [] path; 


path = NULL; 
} 


delete [] reach; 
return path; 


程序 16-9 ”在 图 中 寻找 一 条 路 径 的 递归 方法 


bool rFindPath(int s) 

{// 寻找 路 径 的 实际 算法 。 从 顶点 s 开始 实施 深度 优先 搜索 
/顶点 s 不 应 该 等 于 终点 

1/ 当 且 仅 当 一 条 路 径 找到 了 ， 和 返回 true 


reach[s] = 1; 
vertexIterator<T>* js = iterator(s); 
int u? 
while ((u = is->next()) != 0) 
{1/ 访 问 s 的 一 个 邻接 顶点 
if (reach[u] == 0)  //u 蚌 一 个 没有 到 达 的 顶点 
{/ 移 到 顶点 上 u 
path[++length] = u; // 路 径 中 加 入 u 
if (u == destination || rFindPath (u)) 


return true; 
1/ 从 顶点 到 终点 没有 路 径 
length-—; // 从 路 径 中 删除 u 
} 
} 
delete is; 
return false; 





findPath 首先 初始 化 graph 的 静态 数据 成 员 : destination, path, length 和 reach。 算 法 
实际 上 调用 了 保护 性 方法 graph::rFindPath， 这 个 方法 在 路 径 不 存在 时 ， 返 回 false。 方 法 
graph::rFindPath 对 DFS 做 了 两 点 修改 : 1 ) 一 到 达 路 径 终点 ，rFindPath 就 停止 。2 ) rFindPath 
把 从 源 点 theSource 到 当前 顶点 u 的 路 径 上 的 顶点 都 记录 在 数组 path 中 。 注 意 ，rFindPath 仅 
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当 theSource 关 theDestination 时 被 调用 。 还 要 注意 ，rFindPath 寻找 的 不 必 是 最 短路 径 ( 即 边 
数 最 少 的 路 径 )。 当 用 BFS 替代 DFS 时 ， 寻 找 的 是 最 短路 径 ( 见 练习 45 )。 
findPath 与 dfs 具有 相同 的 复杂 性 。 


16.9.2 连通 图 及 其 构成 


从 任意 一 个 项 点 开始 执行 DFS 或 BFS， 然 后 检验 是 否 所 有 项 点 都 被 标记 为 已 到 达 顶 点 ， 
由 此 可 以 判断 一 个 无 向 图 G 是 否 是 连通 的 ( 见 例 16-2 )。 虽 然 这 个 算法 直接 检验 的 是 ， 从 开 
始 顶 点 到 其 他 每 一 个 顶点 之 间 是 否 存 在 一 条 路 径 ， 但 是 对 于 判断 每 一 对 顶点 之 间 是 否 存在 一 
条 路 径 来 说 ， 这 种 检验 已 经 足够 了 。 假 设 i 是 搜索 的 开始 顶点 并 且 到 达 了 图 的 所 有 顶点 ， 利 
用 i 到 ww 的 反 向 路 径 及 i 到 v 的 路 径 ， 可 以 构成 任意 两 个 顶点 4 和 vv 之 间 的 路 径 。 如 果 图 不 连 
通 ， 则 方法 connected ( 见 程序 16-10 ) 返回 false， 否 则 返回 true。 连 通 的 概念 仅 是 对 无 向 图 
定义 的 ， 要 检验 图 *this 是 否 是 无 向 图 ， 可 以 调用 方法 directed， 当 图 *this 是 有 向 图 时 ， 这 个 
方法 的 返回 值 是 true。 


程序 16-10 ”确定 一 个 无 向 图 是 否 连通 


bool connected () 
{W 当 且 仅 当 图 连通 时 ， 返 回 true 
1/ 确定 这 是 一 个 无 向 图 
if (directed()) 
throw undef inedMethod 
("graph::connected() not defined for directed graphs"); 


int n = numberOfVertices(); 
reach = new int [n + 1]; / 软 认 reach[il = 0 


/给 邻接 于 顶点 1 的 可 到 达 顶 点 做 标记 
dfs(l1, reach, 1); 


// 检查 是 否 所 有 顶点 都 已 标记 
ER (和 nC 和 二 Ly = 二 古寺 ) 
if (reach[i] == 0) 
return false; 
return true; 


} 


在 一 个 无 向 图 中 ， 从 一 个 顶点 i 可 到 达 的 顶点 集合 C 与 连接 C 的 任意 两 个 顶点 的 边 
称 为 连通 构件 (connected component )。 图 16-1b 有 两 个 连通 构件 ， 一 个 由 顶点 {1,2,3} 和 
边 {(1,2)，(1,3)} 组 成 ， 另 一 个 由 剩余 的 顶点 和 边 组 成 。 所 谓 构 件 标记 问题 ( component- 
labeling problem ) 是 指 对 无 向 图 的 顶点 进行 标记 ， 使 得 2 个 项 点 具有 相同 的 标记 ， 当 且 仅 
当 它 们 属于 同一 构件 。 在 图 16-1b 的 例子 中 ， 顶 点 1、2 和 3 可 以 标记 为 1， 而 剩 下 的 项 点 
标记 为 2。 

可 以 反复 调用 DFS 或 BFS 算法 来 给 连通 构件 做 标记 。 从 每 一 个 尚未 标记 的 顶点 开始 进 
行 搜索 ， 并 用 新 的 标号 标记 新 到 达 的 顶点 。 因 此 ， 不 同 构件 中 的 顶点 具有 不 同 的 标记 。 方 法 
graph::labelComponents ( 见 程序 16-11 ) 解决 了 构件 标记 问题 。 该 方法 的 返回 值 是 无 向 图 的 构 
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件数 目 。 构 件 标记 通过 数组 c[1:n] 返回 ， 其 中 n 是 图 的 顶点 数 。 在 程序 16-11 中 ,用 dfs 来 取 
代 bfs， 也 能 得 到 相同 结果 。 当 用 邻接 矩阵 描述 图 时 ， 程 序 16-11 的 复杂 性 是 O(m”) ; 而 用 邻 
接 链 表 描 述 图 时 ， 复杂 性 为 O(n+e)。 


程序 16-11 构件 标记 
int lilabelComponents (int cI[]) 
{VW 给 无 向 图 的 构件 做 标记 
1/ 返回 构件 的 个 数 
// 令 c[i] 是 顶点 1 的 构件 号 
/确定 是 一 个 无 向 图 
if (directed()) 
throw undef inedMethod 
("graph::labelComponents() not defined for directed graphs"); 








int n = numberOofVertices ()，; 


1/ 令 所 有 顶点 是 非 构 件 


faer (iit 1 二 LL < I 于 二 不 


label = 0; /最 后 一 个 构件 的 编号 
/ 确定 构件 
For ‘(和 Ent 主 兰 下 和 = NY 业 十 刷 ) 
if (c[i] == 0) /顶点 并 未 到 达 
{W 顶点 守 是 一 个 新 构件 
label+t+; 
bfs (i，c，label); /给 新 构件 做 标记 
} 


return label; 


16.9.3 ”生成 树 


在 一 个 具有 nn 个 顶点 的 连通 无 向 图 或 网 中 ， 如 果 从 任 一 个 顶点 开始 进行 BFS， 那 么 从 定 
理 16-1 可 知 ， 所 有 顶点 都 将 被 加 上 标记 。 在 graph::bfs ( 见 程序 16-4 ) 的 内 层 while 循环 中 ， 
正好 有 n-1 个 顶点 到 达 。 在 该 循环 中 ， 当 到 达 一 个 新 顶点 zx 时 ， 到 达 的 边 是 (w,wu)。 这 样 得 
到 的 边 集 有 n-1 条 边 ， 且 它 包含 一 条 从 v 到 其 他 每 个 顶点 的 路 径 ， 这 条 路 径 构成 了 一 个 连通 
子 图 ， 该 子 图 即 为 G 的 生成 树 。 

考察 图 16-20a。 如 果 从 顶点 1 开始 进行 BFS， 那 么 边 集 {(12)，(1.3)，(1.4)，(2,5)，(4,6)， 
(4,7)，(5,8)} 是 到 达 以 前 未 到 达 的 顶点 的 边 ， 这 个 边 集 合 与 图 16-20b 的 生成 树 对 应 。 

广度 优先 生成 树 (breadth-first spanning tree ) 是 按 BFS 所 得 到 的 生成 树 。 可 以 验证 图 
16-20b、 图 16-20c 和 图 16-20d 的 生成 树 都 是 图 16-20a 的 广度 优先 生成 树 。 每 一 次 BFS 的 起 
台 顶 点 用 阴影 表示 。 

当 在 一 个 无 向 连通 图 或 网 络 中 执行 DFS 时 ， 到 达 新 顶点 的 边 正 好 有 n-1 条 。 这 些 边 组 成 
的 子 图 也 是 一 棵 生成 树 。 用 DFS 方法 得 到 的 生成 树 叫做 深度 优先 生成 树 ( depth-first spanning 
tree )。 图 16-21 给 出 了 图 16-20a 的 一 些 深度 优先 生成 树 ， 起 始 顶 点 是 1。 
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图 16-20 图 及 其 一 些 广度 优先 生成 树 
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图 16-21 图 16-20a 的 一 些 深度 优先 生成 树 





练习 


45. 使 用 BFS 而 不 是 DFS， 编 写 程序 16-8 的 男 一 个 版 本 。 证 明 由 这 个 版 本 所 得 到 的 从 
theSource 到 theDestination 的 路 径 是 最 短路 径 。 

46. 根据 图 16-20a， 完 成 以 下 练习 : 
1 ) 画 出 从 顶点 3 开始 的 一 个 广度 优先 生成 树 。 
2 ) 画 出 从 顶点 7 开始 的 一 个 广度 优先 生成 树 。 
3 ) 画 出 从 顶点 3 开始 的 一 个 深度 优先 生成 树 。 
4 ) 画 出 从 顶点 7 开始 的 一 个 深度 优先 生成 树 。 

47. 使 用 图 16-4a， 完 成 练习 46。 

48. 编写 方法 graph::bfSpanningTree(theVertex)， 用 于 从 顶点 theVertex 开始 实施 BFS， 在 一 个 
连通 无 向 图 中 寻找 广度 优先 生成 树 。 如 果 没 有 找到 ， 返 回 值 是 NULL。 如 果 找 到 ， 返 回 值 
应 该 是 一 个 边 数组 ， 它 构成 了 生成 树 。 边 数组 的 数据 类 型 是 pair<inbint>。 

49. 编写 方法 graph::dfSpanningTree(theVertex)， 完 成 练习 48。 从 顶点 theVertex 开始 ， 寻 找 一 

棵 深度 优先 生成 树 。 
. 编写 公有 方法 graph::cycle()， 用 于 确定 一 个 无 向 图 是 否 有 一 个 环 路 。 即 可 用 DFS 也 可 用 
BFS 来 实现 。 

1 ) 证 明代 码 的 正确 性 。 

2 ) 确定 程序 的 时 间 和 空间 复杂 性 。 

51. 设 G 是 一 个 无 向 图 。 编 写 方 法 graph::bipartite()， 当 G 不 是 一 个 二 分 图 ( 见 例 16-3 ) 时 ， 
返回 NULL， 当 G 是 二 分 图 时 ,返回 一 个 整 型 数组 label， 这 个 数组 给 顶点 做 了 标记 : 对 
一 个 子 集 的 项 点 ，lable[i]=1， 对 男 一 个 子 集 的 顶点 ，lable[i]=2。 如 果 G 有 个 顶点 且 用 和 抵 
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阵 描 述 ， 那 么 代码 的 复杂 性 应 为 O(n”)。 如 果 用 链表 描述 ， 则 复杂 性 应 为 O(n+e)。 证 明 这 
个 结果 。( 提示 : 执行 若干 次 BFS， 每 次 均 从 目前 未 到 达 的 顶点 开始 。 将 这 个 顶点 分 配 到 
集合 1; 把 邻接 于 该 项 点 的 顶点 分 配 到 集合 2; 把 邻接 至 集合 2 的 顶点 的 顶点 分 配 到 集合 1， 
如 此 进行 下 去 。 还 要 检查 分 配 是 否 有 冲突 ， 即 一 个 顶点 的 分 配 是 否 发 生变 化 )。 

52. 设 G 是 一 个 无 向 图 。 它 的 传递 闭 包 (tansitive closure ) 是 一 个 0/1 数组 tc， 当 且 仅 当 G 存 
在 一 条 边 数 大 于 1 的 从 i 到 j 的 路 径 时 ，tc[i][j]=1。 编 写 一 个 方法 graph::undirectedTC()， 
计算 且 返 回 G 的 传递 闭 包 。 方法 的 复杂 性 应 为 O(n”)， 其 中 是 G 的 顶点 数 。( 提示 : 采 
用 构件 标记 策略 。) 

53. 对 有 向 图 G， 编 写 方法 graph:: directedTC()， 完 成 练习 52。 确 定 方法 的 复杂 性 。 
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概述 


走出 数据 结构 的 世界 ， 进 入 算法 设计 的 天 地 。 从 本 章 开 始 ， 我 们 来 研究 一 些 好 的 算法 设 
计 方 法 。 对 给 定 的 问题 ， 有 些 好 算法 的 设计 方法 更 像 是 艺术 ， 不 像 是 科学 。 但 是 这 些 设计 方 
法 在 解决 实际 问题 时 是 行 之 有 效 的 。 而 且 你 可 以 把 这 些 算法 应 用 到 需要 用 计算 机 求解 的 问题 
上 ， 同 时 实际 地 检验 这 些 算 法 的 性 能 。 一 般 情 况 下 ， 你 必须 对 算法 进行 细致 的 调整 ， 才 能 获 
得 所 需 的 性 能 。 然 而 在 有 些 情况 下 ， 即 使 对 算法 进行 调整 也 无 法 达到 应 有 的 要 求 ， 这 时 就 必 
须 寻 求 另外 的 设计 方法 。 

本 书 的 第 17 ~ 21 章 提 供 了 5 种 基本 的 算法 设计 方法 : 贪 焚 算 法 、 分 而 治之 算法 、 动 态 
规划 、 回 溯 和 分 支 定 界 。 还 有 一 些 更 高 级 的 而 且 常 用 的 方法 ， 如 线性 规划 、 整 数 规划 、 中 心 
网 络 、 遗 传 算法 、 模 拟 退 火 。 这 些 方法 在 本 书 中 没有 涉及 ， 不 过 一 般 在 相关 的 课程 和 书籍 中 
有 详尽 的 描述 。 

本 章 首先 引入 最 优化 的 概念 ， 然 后 介绍 贪 禁 算 法 。 贪 焚 算 法 一 种 非常 直观 的 求解 方法 。 
虽然 设计 一 个 问题 的 贪 禁 算 法 通常 是 很 容易 的 ， 但 是 设计 出 来 的 方法 未 必 能 产生 最 优 的 解 。 
因此 ， 我 们 实质 上 要 显示 一 个 贪 禁 算 法 是 如 何 进行 的 。 即 使 贪 焚 算 法 不 能 保证 最 优 解 ， 但 是 
它们 依然 是 有 用 的 ， 因 为 它们 常常 使 我 们 得 到 近似 最 优 的 解 。 应 用 贪 梦 算法 可 以 求解 货 箱 装 
载 问 题 、 背 包 问 题 、 拓 扑 排序 问题 、 二 分 覆盖 问题 、 最 短路 径 问 题 和 最 小 代价 生成 树 问 题 。 


17.1 最 优化 问题 


在 本 章 及 后 续 章节 中 有 许多 例子 都 是 最 优化 问题 ( optimization problem )。 每 个 最 优化 问 
题 都 包含 一 组 限制 条 件 ( constraint ) 和 一 个 优化 函数 ( optimization function )。 符 合 限 制 条 件 
的 问题 求解 方案 称 为 可 行 解 ( feasible solution )。 使 优化 函数 可 能 取得 最 佳 值 的 可 行 解 称 为 最 
优 解 ( optimal solution )。 

例 17-1[ 渴 婴 问题 ] 一 个 口 淘 而 聪明 的 婴儿 想 要 解 涡 。 她 可 以 得 到 的 饮料 包括 一 杯 水 、 
一 傅 牛 奶 、 多 种 灌 装 的 果汁 、 许 多 瓶装 或 钠 装 的 苏打 水 。 总 之 ， 婴 儿 可 得 到 种 不 同 的 饮料 。 
根据 以 往 的 经 验 ， 她 知道 有 些 饮 料 可 口 ， 有 些 并 不 好 喝 。 因 此 ， 她 要 为 每 一 种 饮料 赋予 一 个 满 
意 度 值 ( satisfaction value ): 饮用 第 i 种 饮料 1 得 司 ， 可 以 给 该 饮料 一 个 数值 s; 作为 满意 度 值 。 

通常 ， 这 个 婴儿 会 饮用 满意 度 值 最 大 的 饮料 。 但 遗憾 的 是 ， 这 种 饮料 的 量 不 多 ， 不 足以 
解渴 。 设 第 i 种 饮料 的 总 量 为 a; 瞧 司 ， 而 解渴 需要 的 总 量 是 1 瞧 司 那么， 每 种 饮料 需要 多 
少 才 能 最 大 限度 地 满足 婴儿 解 光 的 需求 呢 ? 

假设 每 一 种 饮料 都 有 满意 度 值 。 令 x; 为 婴儿 要 饮用 的 第 i 种 饮料 的 量 。 于 是 问题 的 求解 
变 成 寻找 一 组 实数 x; (1 < i<n), 使 六 sn 最 大 , 并 满足 w=1 及 0 < xi < ai。 
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需要 指出 的 是 : 如 果 >a </， 则 问题 无 解 ， 因 为 婴儿 即使 喝 光 所 有 的 饮料 也 不 能 解渴 。 
用 数学 语言 来 表述 问题 是 精确 的 ， 它 可 以 清楚 地 说 明 求 解 问题 的 程序 。 根 据 数学 表述 ， 


我 们 可 以 对 程序 的 输入 /输出 给 出 如 下 形式 的 说 明 : 

输入 : n，1，si;，ai (1 志 i < n,n 为 整数 ， 其 余 为 正 实数 )。 

输出 : 实数 xi (1 < i<n), 使 sm 最 大 是 x =! (0 x a) 如果 <t， 则 输 
出 适当 的 信息 。 


在 这 个 问题 中 ， 限制 条 件 是 学 % =! (0 <xi<ai). 而 优化 函数 是 > wx 。 任何 满足 限制 
条 件 的 一 组 实数 x; 都 是 可 行 解 ， 而 使 守 sx 最 大 的 可 行 解 是 最 优 解 。 国 


例 17-2[ 装载 问题 ] 有 一 艘 大 般 要 装载 货物 。 货物 要 装 在 货 箱 中 ， 所 有 货 箱 的 大 小 都 一 
样 , 但 货 箱 的 重量 各 不 相同 。 设 第 i 个 货 箱 的 重量 为 wi( 1 < i < n ),， 货船 的 最 大 载重 量 为 c。 
我 们 的 目的 是 在 货船 上 装 入 最 多 的 货物 。 

这 个 问题 可 以 精确 地 描述 为 最 优化 问题 : 设 存在 一 组 变量 x;，x; 的 值 是 0 或 1。 如 x; 为 0， 
则 货 箱 i 不 装 船 ; 如 x; 为 1， 则 货 箱 i 装 船 。 我 们 要 找到 一 组 xi， 使 它 满足 限制 条 件 学 ww 
<cHxE{0,l}, 1<i<sn. 优化 函数 是 >%。 


每 一 组 满足 限制 条 件 的 x 都 是 一 个 可 行 解 。 使 2 zx 取得 最 大 值 的 可 行 解 是 最 优 解 。 ”四 


例 17-3[ 最 小 成 本 通信 网 络 ] 这 个 问题 曾 在 例 16-2 中 介绍 过 。 一 组 城市 和 它们 之 间 的 
通信 连接 可 被 描述 为 一 个 无 向 图 。 顶 点 表示 城市 。 边 表示 通信 连接 。 每 条 边 都 有 一 个 表示 建 
设 成 本 的 值 ， 称 为 权 。 每 一 个 包含 所 有 顶点 的 连通 子 图 都 是 一 个 可 行 解 。 假 设 所 有 的 权 都 是 
非 负 的 ， 可 行 解 的 范围 可 以 限定 在 生成 树 的 范围 内 。 一 个 最 优 解 就 是 一 棵 成 本 最 小 的 生成 树 。 

在 这 个 问题 中 ,我 们 需要 选择 边 的 一 个 子 集 ， 这 个 子 集 必须 满足 下 列 条 件 : 构成 一 棵 生 
成 树 。 优 化 函数 是 这 个 边 集 的 权 之 和 。 国 


17.2 贪 禁 算法 思想 


在 贪 禁 算法 ( greedy method ) 中 ， 我 们 要 逐步 构造 一 个 最 优 解 。 每 一 步 ， 我 们 都 在 一 定 
的 标准 下 ， 作 出 一 个 最 优 决策 。 在 每 一 步 做 出 的 决策 ， 在 以 后 的 步骤 中 都 不 可 更 改 。 做 出 决 
策 所 依据 的 标准 称 为 贪 梦 准则 ( greedy criterion )。 

例 17-4[ 找 零钱 ] 一 个 小 孩 用 1 美元 来 买 价值 不 足 1 美元 的 糖果 ， 售 货 员 和 希望 用 数目 最 
少 的 硬币 找 给 小 孩 零 钱 。 假 设 有 面值 为 25 美 分 、10 美 分 、5 美 分 及 1 美 分 的 硬币 ， 而 且 数 目 
不 限 。 售 货 员 每 次 选择 一 枚 硬币 ， 凑 成 要 找 的 零钱 。 选 择 时 所 依据 的 是 贪 禁 准 则 : 在 不 超过 
要 找 的 零钱 总 数 的 条 件 下 ， 每 一 次 都 选择 面值 尽 可 能 最 大 的 硬币 。 直 到 凑 成 的 零钱 总 数 等 于 
要 找 的 零钱 总 数 。 

假设 要 找 给 小 孩 67 美 分 。 前 两 步 选 择 的 是 两 个 25 美 分 的 硬币 ( 第 三 步 就 不 能 选择 25 美 
分 的 硬币 ,否则 零钱 总 数 就 超过 67 美 分 )， 第 三 步 选 择 10 美 分 的 硬币 ， 然 后 是 $ 美 分 的 硬 
币 ， 最 后 是 两 个 1 美 分 的 硬币 。 
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贪 禁 算法 使 我 们 有 一 种 感性 认识 : 这 样 凑 出 的 零钱 ， 硬 币 数目 最 少 或 接近 最 少 。 其 实 可 
以 证 明 ， 的 确 最 少 ( 见 练习 1 )。 加 

例 17-5[ 机 器 调度 ] 有 任务 n 个， 机 器 不 限 ， 任 务 在 机 器 上 处 理 。 每 个 任务 的 开始 时 间 
为 s;， 完 成 时 间 为 f，si<fi。[s;, 几 为 任务 i 的 处 理 时 段 ( processing interval )。 两 个 任务 i 和 j 
重 倒 ， 当 且 仅 当 这 两 个 任务 的 处 理 时 段 有 重 共 ,但 不 含 始点 或 终点 。 例 如 ， 时 段 [1，4 与 时 
段 [2，4] 有 重合 ， 而 与 时 段 [4，7] 不 重 盖 。 一 个 任务 分 配方 案 是 可 行 的 ， 是 指 没有 两 个 处 理 
时 段 重 至 的 任务 分 配给 同一 台 机 器 ， 即 每 台 机 咒 在 任何 时 刻 最 多 只 处 理 一 个 任务 。 最 优 分 配 
(optimal assignment ) 是 指使 用 机 器 最 少 的 可 行 分 配方 案 。 

假设 有 z=7 个 任务 ， 标 号 从 a 到 g。 它 们 的 处 理 时 段 如 图 17-1a 所 示 。 一 个 可 行 的 任务 
分 配方 案 是 将 任务 a 分 给 机 器 M1， 任务 b 分 给 机 器 M2，…，, 任务 g 分 给 机 器 WM7， 但 不 是 
最 优 分 配 ， 因 为 有 其 他 的 分 配方 案 是 用 的 机 器 更 少 。 例 如 ， 把 任务 a、.b、d 分 配给 同一 台 机 器 ， 
机 器 数 降 为 5 台 。 

一 种 获得 最 优 分 配方 案 的 贪 焚 方法 是 逐步 分 配 任务 。 每 步 分 配 一 个 任务 ， 且 按 任务 开始 
时 间 的 非 递 减 次 序 进 行 分 配 。 一 台 机 器 ， 如 果 至 少 已 经 有 了 一 个 任务 ， 则 称 为 “ 旧 ” 机 器 ; 
否则 称 为 “新 ”机 器 。 在 选择 机 器 时 ， 采 用 的 贪 焚 准 则 是 : 根据 任务 的 开始 时 间 ， 若 有 “ 旧 ” 
机 器 可 用 ， 则 将 任务 分 配给 它 。 否 则 ， 将 任务 分 配给 一 台 “ 新 ”机 器 。 

根据 图 17-1a 的 数据 ， 按 照 任务 起 始 时 间 的 非 递 减 顺 序 ， 任 务 分 配 的 顺序 为 a、fb、c、g、 
e、d。 贪 焚 算 法 按照 这 个 顺序 把 任务 分 配给 机 器 。 算 法 有 7 步 (n=7 ),， 一 步 分 配 一 个 任务 。 
第 一 步 考虑 任务 wa， 因为 没有 “ 旧 ” 机 器 ， 所 以 将 a 分 配给 一 台 “ 新 ”机 器 (例如 ，M1 )。 这 
台 机 器 在 0 到 2 时 刻 处 于 工作 状态 ( 如 图 17-lb 所 示 )。 第 二 步 考虑 任务 f。 因 为 在 f 的 起 始 时 
刻 ,“ 旧 ”机 器 仍 处 于 工作 状态 ， 所 以 将 分 配给 一 台 “ 新 ”机 器 ( 例如 ，M2 )。 第 三 步 考虑 
任务 bp。 任务 b 的 起 始 时 刻 ss=3， 这 时 








“ 旧 ” 机 器 MI1 已 处 于 空闲 状态 ， 因 此 将 5 4 a . a 8 
分 配给 MI。aM1 的 可 用 时 刻 变 成 1=7。 结束 |2 7 7 11 10 5 
M2 的 可 用 时 刻 变 为 f= 二 5。 第 四 步 考虑 任 a) 7 个 任务 


务 c。 它 的 起 始 时 刻 为 s.=4。 这 时 没有 
“ 旧 ” 机 器 可 用 ， 因 此 将 c 分 配给 一 台 
“新 ”机 器 ( 例如，M3 )。 这 人 台 机 器 的 可 用 
时 间 变 为 人 =7。 第 五 步 考 虑 任务 g&， 将 其 
分 配给 机 器 MD2。 第 六 步 将 任务 e 分 配给 机 
器 M1 或 M3， 假设 是 MI。 最 后 第 七 步 将 
任务 4 分 配给 机 器 M2 或 M3， 假设 是 M3。 

从 上 述 贪 焚 算 法 可 以 得 到 最 优 分 配 。 时 间 
它 的 证 明 留 作 练习 (练习 7), 采用 一 个 复 b) 调度 
杂 性 为 O(nlogn) 的 排序 算法 ( 如 堆 排 序 )， 
按 s; 的 非 递 减 次 序 排列 排序 ， 然 后 使 用 一 
个 关于 “ 旧 ” 机 器 可 用 时 刻 的 最 小 堆 ， 便 可 
实现 一 个 复杂 性 为 O(nlogn) 的 贪 禁 算法 。 国 

例 17-6[ 最 短路 径 ] 一 个 有 向 网 如 
图 17-2 所 示 。 一 条 路 径 的 长 度 是 其 所 有 
边 的 成 本 之 和 。 要 求 找 一 条 从 起 始 顶点 8 图 17-2 有 向 图 





图 17-1 任务 及 一 个 三 台 机 器 的 调度 








到 达 目 的 项 点 4 的 最 短路 径 。 

用 贪 焚 算法 构造 这 样 一 条 路 径 需 要 分 步 进 行 。 每 一 步 都 向 路 径 上 加 入 一 个 顶点 。 假 设 当 
前 的 路 径 已 到 达 顶 点 gqg, 但 g 并 不 是 目的 顶点 d 在 下 一 步 确定 一 个 可 以 加 入 路 径 中 去 的 顶点 
时 所 采用 的 贪 禁 准则 为 :选择 一 个 关联 于 g 最 近 的 ， 且 目前 不 在 路 径 中 的 顶点 。 
这 种 贪 禁 算法 并 不 一 定 能 获得 最 短路 径 。 例 如 ， 在 图 17-2 中 ,要 构造 从 顶点 1 到 顶点 5 
的 最 短路 径 。 采 用 刚刚 描述 的 贪 禁 准 则 ， 从 顶点 1 开始 ， 移动 最 近 的 但 不 在 路 径 中 的 顶点 ， 
因此 到 达 顶 点 3， 长 度 仅 为 2。 从 顶点 3 可 以 到 达 的 最 近 顶 点 为 4。 从 顶点 4 到 达 顶 点 2， 然 
后 到 达 目 的 顶点 5。 得 到 的 路 径 为 1,3,4,2,5， 其 长 度 为 10。 这 条 路 径 并 不 是 从 1 到 5 的 最 短 
路 径 。 事 实 上 ， 有 几 条 更 短 的 路 径 。 例 如 1，4，5， 其 长 度 为 6。 国 

既然 在 本 节 你 已 经 看 到 了 三 个 贪 禁 算法 的 实例 ， 那 么 你 可 以 重 温 在 前 几 音 所 考察 的 应 用 ， 
其 中 也 有 若干 个 贪 禁 算 法 。 例 如 ，12.6.3 节 的 霍 夫 曼 树 算法 ， 利 用 n-1 步 建立 加 权 外 部 路 径 
长 最 小 的 二 又 树 ， 每 一 步 都 将 两 棵 二 叉 树 合并 为 一 棵 。 算 法 所 使 用 的 贪 禁 准则 为 : 从 可 用 的 
二 叉 树 中 把 权 最 小 的 两 棵 树 组 合 为 一 棵 树 。 

12.6.2 节 的 LPT 调度 规则 也 是 一 种 贪 焚 算法 。 它 用 n 步 来 调度 个 作业 。 首 先 将 作业 按 
时 间 长 短 排序 。 然 后 每 一 步 为 下 一 个 任务 分 配 一 台 机 器 。 依 据 的 贪 焚 准 则 为 : 使 目前 的 调度 
时 间 最 每 。 将 新 作业 调度 到 最 先 完成 的 机 器 上 (〈 即 最 先 空 闲 的 机 器 )。 

注意 ， 在 12.6.2 节 中 的 机 器 调度 问题 中 ， 贪 焚 算 法 并 不 能 保证 最 优 解 。 但 是 给 人 的 直 
觉 是 这 样 的 ， 而 且 一 般 情况 下 它 的 解 总 是 非常 接近 最 优 解 。 这 是 一 种 经 验 法 则 (a rule of 
thumb )， 它 在 实际 的 调度 问题 中 ， 用 机 器 来 实现 调度 过 程 。 不 保证 得 到 最 优 解 ， 但 所 得 的 结 
果 通 常 都 接近 最 优 解 ， 这 种 算法 称 为 启发 式 方法 (heuristics)。 因 此 LPT 方法 是 一 种 启发 式 机 
器 调度 方法 。 定 理 9-2 表达 了 LPT 调度 的 完成 时 间 与 最 佳 调度 的 完成 时 间 之 间 的 限定 关系 ， 
因此 LPT 启发 式 方法 具有 限定 性 能 ( bounded performance )。 具 有 限定 性 能 的 启发 式 方法 称 为 
近似 算法 ( approximation algorithm )。 

13.5.1 节 讲 述 了 解决 箱子 装载 问题 的 几 种 具有 限定 性 能 的 启发 式 方法 ( 即 近似 算法 )， 每 
一 种 启发 式 方法 都 是 贪 焚 启 发 法 ，12.6.2 节 的 LPT 法 也 是 一 种 贪 禁 启 发 式 方法 。 所 有 这 些 启 
发 式 方法 在 直觉 上 对 人 都 有 一 种 吸引 力 ， 并 在 实际 应 用 中 也 能 得 到 接近 最 优 解 的 结果 。 

本 章 的 剩余 部 分 将 介绍 几 种 贪 禁 算法 的 应 用 。 在 一 些 应 用 中 的 算法 总 能 产生 最 优 解 决 方 
案 。 对 另外 一 些 应 用 的 算法 只 是 一 种 启发 式 方法 ,它们 可 能 是 近似 算法 ， 也 可 能 不 是 。 


练习 


1. 售货员 只 要 有 足够 的 硬币 ( 包括 25 美 分 、10 美 分 、5 美 分 和 1 美 分 )， 使 用 找 零钱 问题 ( 例 
17-4 ) 的 贪 禁 算法 ， 总 能 凑 出 硬币 最 少 的 零钱 。 请 证 明 这 个 结论 。 

2. 考虑 例 17-4 的 找 零钱 问题 。 假 设 售货员 只 有 有 限 的 硬币 (包括 25 美 分 、10 美 分 、5 美 分 
和 1 美 分 )， 设 计 一 个 找 零 钱 的 贪 焚 算 法 。 这 种 方法 总 能 凑 出 硬币 最 少 的 零钱 吗 ? 证明 你 的 
结果 。 

3. 扩充 例 17-4 的 算法 。 假 定 售 货 员 不 仅 有 各 种 硬币 (25 美 分 、10 美 分 、5 美 分 和 1 美 分 )， 
而 且 有 各 种 面额 的 纸币 (50 美元 、20 美元 、10 美元 、5 美元 和 1 美元 )。 一 位 顾客 购买 了 
x 美元 和 yy 美 分 的 商品 ， 付 了 wu 美元 和 v 美 分 。 使 用 你 的 算法 总 能 凑 出 纸币 和 硬币 最 少 的 零 
钱 吗 ”证 明 结 论 。 

4. 编写 一 个 C++ 程序 ， 实 现 例 17-4 的 找 零钱 算法 。 假 设 售 货 员 有 面额 为 100 美元 、20 美元 、 
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10 美元 、5 美元 和 1 美元 的 纸币 和 各 种 硬币 。 程 序 包 括 一 个 输入 函数 ， 输 入 顾客 所 购买 的 
商品 价格 及 所 付 的 钱 数 。 还 包括 一 个 输出 函数 ， 输 出 所 找 零钱 数 及 各 种 面额 的 货币 数 。 

5. 假设 某 个 国家 具有 币值 为 14、12、5 和 1 分 的 硬币 。 这 时 使 用 例 17-4 的 贪 禁 算法 总 能 凑 出 
硬币 最 少 的 零钱 吗 ? 证 明 结 论 。 

6. 1 ) 证 明 例 17-5 的 贪 禁 算法 总 能 找到 最 优 任 务 分 配方 案 。 

2 ) 编程 实现 这 种 算法 ， 其 日 复杂 性 为 O(nlogn)， 其 中 是 任务 数 。 

7. 考察 例 17-5 的 机 器 调度 问题 。 假 定 仅 有 一 台 机 器 可 用 ， 而 且 选 择 最 大 数量 的 任务 在 这 人 台 机 
器 上 执行 。 例 如 ， 所 选择 的 最 大 任务 集合 为 {a,b,e}。 ET I 
择 任务 。 每 一 步 选择 一 个 任务 ， 所 依据 的 贪 禁 准 则 如 下 : 从 剩 下 的 任务 中 选择 具有 最 少 
成 时 间 且 不 与 现 有 任务 重 有 登 的 任务 。 

1 ) 证 明 上 述 贪 楚 算 法 能 够 获得 最 优选 择 
2 ) 实现 该 算法 ， 其 复杂 性 应 为 O(nlogn)。( 提示 : 采用 一 个 完成 时 间 的 最 小 堆 。) 


17.3 应 用 
17.3.1 ” 货 箱 装载 


1. 贪 禁 法 求解 

这 个 问题 来 自 例 17-2。 把 货 箱 分 步 装载 到 货船 上 ， 一 步 装 载 一 个 货 箱 。 每 一 步 决定 装载 
哪 一 个 货 箱 。 做 决定 所 依据 的 贪 焚 准 则 是 : 从 剩 下 的 货 箱 中 ， 选 择 重 量 最 小 的 货 箱 。 这 样 可 
以 保证 所 选 的 货 箱 总 重量 最 小 ， 从 而 使 货船 用 最 大 的 容量 来 装载 更 多 的 货 箱 。 根据 这 种 贫 杰 
策略 ， 首 先 选择 最 轻 的 货 箱 ， 然 后 选择 次 轻 的 货 箱 ， 如 此 下 去 ， 直 到 所 有 货 箱 均 装 上 船 ， 或 
船上 不 能 再 容纳 一 个 货 箱 的 空间 。 

例 17-7 假设 n=8, [wi…,ws]=[100,200,50,90,150,50,20,80], c=400。 利 用 上 述 的 贪 禁 算法 ， 
按 序 装载 货 箱 为 7,3,6,8,4,1,5,2。 货 箱 7,3,6,8,4,1 的 总 重量 为 390， 把 它们 装载 之 后 ， 货 船 可 
用 的 装载 容量 为 10， 已 经 装 不 下 剩 下 的 任何 一 个 货 箱 。 得 到 的 解 为 [x1,…,xs]=[1,0,1,1,0,1,1,1] 
且 >xi=6。 国 

2. 贪 禁 算 法 的 正确 性 

定理 17-1 利用 上 述 贪 禁 算法 能 产生 最 佳 装载 。 

证 明 令 x=[x1,…,xs] 是 用 贪 禁 算法 获得 的 解 ，y=[y1,…,y,] 是 任意 一 个 可 行 解 。 证 明 
D> Dy。 不 失 一 般 性 ， 可 以 假设 货 箱 都 已 排序 : w, < wist (1 < Km )。 根据 上 述 仿 禁 算 
法 的 做 法 可 知 ， 存 在 一 个 (0 志 k<n), 使 得 x=1, i 大 且 x=0, i>k。 

我 们 对 x; 关 y; 的 i 的 数量 p 应 用 归纳 法 。 对 归纳 基础 部 分 ， 当 p=0 时 , x 和 yy 相等。 因 
此 宛 n> Dh 对 归纳 假设 部 分 ,， 今 m 是 任意 一 个 自然 数 ， 假设 p< m 时 有 n> 


成 立 。 


在 归纳 步骤 阶段 ， 证 明 当 p=m+1 时 ，>%>D>%。 寻 找 最 小 整数 j, 1 <j < 使 
得 xj; yj 因为 p 关 0， 所 以 存在 这 样 一 个 j。 还 有 /7 友人， 否则 ?不 是 一 个 可 行 解 。 因 为 
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Xj, N=1， 所 以 y=0。 令 y=1。 
如 果 得 到 的 y 是 一 个 可 行 解 ， 那 么 令 = 表 示 y。 这 时 在 范围 [k+l,] 内 必 有 有 一 个 1， 使 得 
ye1。 令 ye0，z 表 示 y。 因 为 w < w。 所 以 z 是 一 个 可 行 的 装载 


在 任何 一 种 情况 下 ， Ys > yy ， 而 且 最 多 在 p-1=m 的 位 置 上 , z 与 x 不同。 由 归纳 假 
设 得 知 ， ph 田 

3. C++ 实现 

程序 17-1 是 货 箱 装载 贪 焚 算 法 的 C++ 代码 。 数 据 类 型 container 含有 整 型 数据 成 员 id 和 
weight。id 表示 货 箱 的 范围 ， 从 1 到 货 箱 数 量 。weight 表示 货 箱 重量 。 类 型 container 还 定义 
了 一 个 向 整 型 的 类 型 转换 ， 返 回 值 是 weight 域 的 值 。 因 此 ， 当 类 型 container 的 对 象 进行 比较 
时 ， 比 较 的 是 货 箱 的 重量 。 

程序 17-1 首先 使 用 堆 排 序 法 ( 程序 12-8 ) 按 重 量 对 货 箱 排序 。 然 后 按 重量 递增 顺序 ， 把 
货 箱 装 上 船 。 排 序 用 时 O(nlogn)， 其 中 是 货 箱 数 量 。 算 法 其 余部 分 用 时 O(n)， 因 此 程序 
17-1 的 复杂 性 为 O(nlogn)。 


程序 17-1 ” 货 箱 装载 
void containerLoading (container* c, int capacity, int numberOfContainers, int* x) 
{// 货 箱 装 载 的 贪 焚 算 法 
1/ 令 x[i] = 1， 当 且 仅 当 货 箱 羡 (i >= 1) 已 装载 
// 按 重量 递增 排列 


heapSort(c, numberOfContainers); 
int n = numberOfContainers; 


/初始 化 
FOr 《TD 主 专 17 宇 六 页》 4 站) 
x[i] = 0; 
// 按 重量 顺序 选择 货 箱 
for (int i = 1; i <= n && c[i] .weight <= capacity; i++) 
{1/ 对 货 箱 c[i] .id 有 足够 的 容量 
EGI) asia) s 8 
capacity -= c[i] .weight; /剩余 容量 


17.3.2 0/1 背包 问题 


1. 问题 描述 

有 nn 个 物品 和 一 个 容量 为 c 的 背包 ， 从 nn 个 物品 中 选取 装 包 的 物品 。 物 品 i 的 重量 为 wi， 
价值 为 pi。 一 个 可 行 的 背包 装载 是 指 ， 装 包 的 物品 总 重量 不 超过 背包 的 容量 。 一 个 最 佳 背包 
装载 是 指 ， 物 品 总 价值 最 高 的 可 行 的 背包 装载 。 问 题 的 公式 描述 是 


max 》， pix 
约束 条 件 是 加 
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Dwxs<cHxe{0,l} 1l<ign 
i=1 


在 这 个 公式 中 ,我们 要 求 出 x; 的 值 。x=1 表示 物品 i 装 人 背包 ,xj=0 表示 物品 i 没有 装 人 背包 。 
0/1 背包 问题 实际 上 是 一 个 一 般 化 的 货 箱 装 载 问题 ， 只 是 从 每 个 货 箱 所 获得 的 价值 不 同 。 在 这 
里 ， 船 是 背包 ， 货 箱 是 可 装 人 背包 的 物品 。 

例 17-8 ”杂货 店 有 一 场 比 赛 ， 第 一 名 将 获得 一 车 免费 的 商品 。 杂 货 店 有 n 种 商品 。 比 
赛 规 则 规定 ， 从 每 种 商品 中 只 能 取 一 件 。 手 推 车 的 容量 为 c， 商 品 i 的 体积 为 w， 价 值 为 
Pi。 你 的 目标 是 ， 装 入 手推车 的 商品 的 总 价值 最 大 。 当 然 ， 商 品 不 能 超过 手推车 的 容量 ， 
而 且 一 种 商品 最 多 只 能 一 件 。 这 个 问题 可 用 0/1 背包 问题 来 建 模 。 手 推 车 对 应 背包 ， 商 品 
对 应 物品 。 加 

2. 可 能 的 贪 禁 策略 

0/1 缘 包 问题 有 若干 种 贪 禁 策略 。 每 种 都 需要 多 步 实 现 。 每 一 步 选 择 一 个 物品 装 和 人 背包。 
一 种 价值 贪 焚 准 则 是 : 从 剩余 的 物品 中 选 出 可 以 装 入 背包 的 价值 最 大 的 物品 。 利 用 这 种 规则 ， 
首先 是 在 可 装 人 背包 的 物品 中 ， 选 择 一 个 价值 最 大 的 物品 ， 然 后 在 剩余 的 可 装 人 背包 的 物品 
中 ， 选 择 一 个 价值 最 大 的 物品 ， 如 此 继续 下 去 。 使 用 这 种 策略 ， 不 一 定 得 到 最 优 解 。 例 如 ， 
1H=3，w=[100,10,10]，p=[20,15,15]，c=105。 使 用 上 述 的 价值 贪 焚 准则 ， 得 到 的 解 是 x=[1,0,0]， 
其 总 价值 为 20。 而 最 优 解 为 [0,1,1]， 其 总 价值 为 30。 

另 一 种 是 重量 贪 焚 准 则 : 从 剩余 的 物品 中 选 出 可 装 入 背包 的 重量 最 小 的 物品 。 使 用 这 种 
规则 虽然 对 上 面 的 实例 可 以 产生 最 优 解 ， 但 是 在 一 般 情况 下 不 行 。 例 如 ，n=2，w=[10,20]， 
p=[5,100]，c=25。 利 用 重量 贪 禁 准则 的 结果 是 x=[1,0]， 比 最 优 解 [0,1] 要 差 。 

还 有 一 种 是 价值 密度 pj/w: 贪 禁 法 则 : 从 剩余 物品 中 选 出 可 装 入 包 的 pi/wi 值 最 大 的 物品 。 
这 种 策略 也 不 能 保证 得 到 最 优 解 。 例 如 ， 对 n=3，w=[20,15,15]，p=[40,25,25]，c=30， 使 用 这 
种 策略 ， 看 一 看 是 否 能 得 到 最 优 解 。 

3. 贪 禁 启发 式 方法 

上 面 讨论 的 几 个 贪 焚 算 法 都 不 能 保证 得 到 最 优 解 ， 但 是 我 们 不 必 诅 丧 。0O/1 背包 问题 是 
一 个 NP- 复杂 问题 ( 见 12.6.2 节 )。 虽 然 价 值 密度 贪 焚 法 则 不 能 保证 最 优 解 ， 但 是 我 们 认为 
它 是 一 个 好 的 启发 式 算法 ， 而 且 在 更 多 的 时 候 ， 它 的 解 非常 接近 最 优 解 。 在 一 项 实验 中 ， 对 
随机 产生 的 600 个 背包 问题 ， 利 用 这 种 启发 式 贪 禁 算法 求 得 的 解 有 239 个 为 最 优 解 。 有 583 
个 解 与 最 优 解 相差 10%， 因 此 ， 所 有 600 个 解 与 最 优 解 之 差 全 在 25% 以 内 。 而 且 该 算法 能 在 
O(nlogn) 时 间 内 完成 ， 这 是 非常 好 的 性 能 。 

我 们 也 许 会 问 ， 是 否 对 一 些 xCx<100)， 贪 禁 启 发 式 方法 可 以 保证 其 结果 与 最 优 值 相 差 在 
x% 以 内 。 答 案 是 否定 的 。 为 说 明 这 一 点 ， 考 虑 例子 n=2，w=[1,y], p=[10,9y] 和 c=y。 贪 焚 算 
法 的 解 为 x=[1,0]。 它 的 值 为 10。 对 于 ”= 10/9， 最 优 解 的 值 为 9y。 因 此 ， 贪 禁 算 法 的 解 与 最 
优 解 的 差 对 最 优 解 的 比例 为 ((9y-10)/(9y)*100 ) %。 当 ?很 大 时 ， 这 个 值 趋 近 于 100%。 

我 们 可 以 修改 贪 禁 启发 式 方法 ,使 解 的 结果 与 最 优 解 的 值 之 差 在 最 优 值 的 x%(x<100) 之 
内 。 首 先 将 最 多 k 件 物品 放 入 背包 。 如 果 这 kk 件 物 品 重 量 大 于 c， 则 放弃 它 。 否 则 ， 根 据 背 包 
剩余 的 容量 ， 考 虑 将 剩余 物品 按 pyw; 的 递减 顺序 装 和 人 背包。 考虑 最 多 有 上 大 件 物品 的 所 有 可 能 
的 子 集 而 得 到 的 最 好 的 解 就 是 启发 式 方法 产生 的 解 。 

例 17-9 考虑 一 个 背包 问题 实例 : n=4，w=[2,4,6,7]，p=[6,10,12,13]，c=11。 当 =0 时 ， 
将 物品 按 其 价值 密度 的 非 递 增 顺 序 装 人 和 人 背包。 首先 将 物品 1 放 和 人 人 背包， 然后 是 物品 2。 这 时 ， 
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背包 剩 下 的 容量 为 5。 剩 下 的 物品 没有 一 个 可 以 装 和 背包， 因此 解 为 地 [1,1.0.0]。 此 解 的 价值 
为 16。 国 

现在 考虑 入 1 时 的 贪 禁 启发 式 方法 。 最 初 的 子 集 为 {1},{2},{3},{4}。 子 集 和 1},{2} 产生 
与 k=0 时 相同 的 结果 ， 考 虑 子 集 {3}， 置 xx=1。 这 时 的 背包 还 剩 5 个 单位 的 容量 ， 按 价值 密 
度 非 递增 顺序 来 考虑 如 何 利用 这 5 个 单位 的 容量 。 首 先 考虑 物品 1， 它 可 以 装 人 背包 ， 因 此 
取 xzi=1。 这 时 的 背包 仅 剩 下 3 个 单位 容量 ,剩余 物品 都 装 不 进去 。 通 过 子 集 {3} 开始 求解 ， 
得 到 的 结果 为 x=[1,0,1,0]， 获 得 的 价值 为 18。 若 从 子 集 {4} 开始 ， 得 到 的 解 为 x=[1,0,0,1]， 获 
得 的 价值 为 19。 考 虑 了 子 集 大 小 为 0 和 1 的 情况 后 ， 获 得 了 最 好 的 解 为 [1,0,0,1]。 这 个 解 是 
从 丘 1 时 的 贪 禁 启发 式 算法 得 到 的 。 

若 k=2， 除 了 考虑 k<2 的 子 集 ， 还 要 考虑 子 集 {1,2},{1,3},{1,4},{2,3},{2,4} 和 {3,4}。 首 
先 从 最 后 一 个 子 集 开 始 ， 它 是 不 可 行 的 ， 故 将 其 抛弃 。 对 剩 下 的 子 集 求解 分 别 得 到 如 下 结果 : 
[1,1,0,0],[1,0,1,0],[1,0,0,1],[0,1,1,0] 和 [0,1,0,1]。 最 后 一 个 结果 的 价值 为 23， 它 的 价值 比 二 0 
和 有 1 时 的 结果 要 高 。 这 个 结果 即 为 启发 式 方法 产生 的 结果 。 

由 修改 后 的 贪 禁 启发 式 方法 得 到 的 解 称 为 k 阶 优化 (k-optimal )。 也 就 是 说 ， 如 果 从 解 中 
取出 件 物品 ， 并 放 入 另外 上 件 物品 ， 那 么 获得 的 结果 不 会 比 原来 的 好 。 而 且 用 这 种 方式 获 
得 的 值 在 最 优 值 的 (100/(k+1)) % 以 内 。 因 此 ， 我 们 把 这 种 启发 式 方法 称 为 有 界 性 能 (bounded 
performance ) 启发 式 。 当 k=1 时 ,保证 最 终结 果 在 最 佳 值 的 50% 以 内 ; 当 磋 2 时， 则 在 
33.33% 以 内 ， 等 等 ， 有 界 性 能 启发 式 方法 的 
执行 时 间 随 丰 的 增 大 而 增加 ， 需 要 尝试 的 子 集 | 
数目 为 O(n ， 每 一 个 子 集 所 需 时 间 为 O(n)。 239 | 390 | 528 | 583 
还 有 ， 物 品 按 价值 比率 排序 所 需 时 间 为 ed 2 end ha 
O(nlogn)。 因 此 当 fz0 时 ， 总 时 间 为 O(n')。 

实际 考察 的 性 能 要 好 得 多 ,图 17-3 给 出 图 17-3 600 个 例子 中 差 值 在 x% 以 内 的 数目 
了 600 种 随机 测试 的 统计 结果 。 


17.3.3 ”拓扑 排序 





1. 问题 描述 

一 个 复杂 的 工程 ， 经 常 可 以 分 解 成 一 组 简单 一 些 的 任务 ， 这 些 任 务 完成 了 ， 整 个 工程 也 
就 完成 了 。 例 如 ， 汽 车 装配 工程 可 分 解 为 以 下 任务 : 将 底盘 放 到 装配 线 上 、 安 装 车 轴 、 安 装 
车 轮 、 将 座位 装 在 底盘 上 、 喷 漆 、 装 刹车 、 装 车 门 ， 等 等 。 而 且 任务 之 间 具 有 先后 关系 ， 例 
如 在 安装 车 轴 之 前 必须 先 将 底盘 放 到 装配 线 上 。 这 组 任务 和 任务 的 先后 顺序 可 用 有 向 图 表 
示 称 为 顶点 活动 (activity on vertex，AOV ) 网 络 。 顶 点 代表 任务 ， 有 向 边 (i,/) 表示 这 样 
的 先后 关系 : 任务 j 开 始 前 任务 i 必须 完成 。 图 17-4 表示 一 个 工程 ， 它 有 6 个 任务 。 边 (14) 
表示 任务 1 要 在 任务 4 开始 前 完成 。 同 样 , 边 (4,6 ) 表示 任务 4 要 在 任务 6 开始 前 完成 。 边 
(14) 与 (4,6 ) 合 起 来 表示 任务 1 要 在 任务 6 开始 前 完成 ， 即 前 后 关系 是 传递 的 。 通 过 观察 
可 知 ， 边 ( 1,4 ) 是 多 余 的 ， 因 为 边 (1,3 ) 和 (3,4 ) 已 含有 这 种 关系 。 

在 很 多 情况 下 ,我们 必须 连续 执行 一 组 任务 ,， 例如， 解决 汽 车 装配 问题 ,或 组 装 带 有 
“组 装 说 明 ” 的 消费 品 ( 自行 车 、 小 孩 的 秋千 装置 、 割 草 机 ， 等 等 )。 这 时 ， 我们 会 根据 组 装 
建议 ， 按 照 一 个 顺序 来 执行 装配 任务 。 这 样 就 形成 一 个 任务 序列 ， 对 任务 有 向 图 的 任意 一 条 
边 【i,j )， 在 这 个 序列 中 ,任务 i 一 定 出 现在 任务 j 的 前 面 。 具有 这 种 性 质 的 序列 称 为 拓扑 序 
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列 (topological order 或 topological sequence)。 根据 任务 有 向 图 建立 拓扑 序列 的 过 程 称 为 拓扑 
排序 ( topological sorting )。 

图 17-4 的 任务 有 向 图 有 若干 个 拓扑 序列 。 其 中 的 三 个 是 
123456, 132456 和 215346。 而 序列 1423556 不 是 拓 
扑 序列 ， 因 为 在 这 个 序列 中 ， 任 务 4 在 任务 3 的 前 面 ， 而 在 任 
务 有 向 图 中 存在 边 (3,4 )， 这 条 边 表 示 ， 在 序列 中 ,任务 4 应 
该 出 现在 任务 3 的 后 面 。 序 列 的 顺序 与 边 所 表示 的 顺序 相 矛 盾 。 

2. 贪 禁 求解 

我 们 可 以 制定 一 个 贪 焚 算 法 ， 它 按 从 左 到 右 分 步 构造 拓扑 图 17-4 任务 有 向 图 
序列 。 每 一 步 选择 一 个 新 顶点 加 入 序列 中 。 选 择 新 项 点 的 依据 是 贪 楚 准则 : 从 剩余 的 顶点 中 
选择 一 个 顶点 w， 它 没有 这 样 的 入 边 (ww)， 其 中 顶点 v 不 在 序列 中 。 注 意 ， 如 果 选 择 了 一 个 
顶点 w， 它 不 满足 上 述 的 贪 焚 法 则 ( 即 边 (ww ) 中 的 顶点 v 不 在 序列 中 )， 那 么 就 构造 不 出 
拓扑 序列 ， 因 为 顶点 一 定 在 顶点 ww 之后。 图 17-5 简化 了 这 个 算法 ， 其 中 while 语句 的 每 一 
次 循环 都 表示 算法 的 一 个 步 又。 





令 nn 表示 有 向 图 的 项 点数 

令 theOrder 是 空 序列 

while(true) 

{ 
令 w 是 任意 一 个 没有 和信 边 (ww ) 的 顶点 ， 其 中 vv 不 在 theOrder 中 
如 果 没 有 这 样 的 顶点 w， 程 序 终 止 
把 w 加 到 theOrder 的 尾部 


} 

if(theOrder 的 项 点数 小 于 n) 
算法 失败 

else 
theOrder 是 一 个 拓扑 序列 





17-5 ”拓扑 排序 


我 们 针对 图 17-4 的 有 向 图 来 应 用 这 个 算法 。 从 一 个 空 序列 theOrder 开始 。 第 一 步 选 
择 插 入 序列 theOrder 的 第 一 个 项 点 。 为 此 ， 有 两 个 候选 者 ， 顶 点 1 和 2。 若 选择 2， 则 序 
列 theOrder=2， 第 一 步 完成 。 第 二 步 选择 插入 序列 theOrder 的 第 二 个 顶点 ， 由 贪 禁 准则 可 
知 ， 这 时 的 候选 顶点 为 1 和 5。 若 选择 5S， 则 theOrder=25， 第 二 步 完 成 。 第 三 步 ， 顶 点 1 
是 唯一 的 候选 者 ， 因 此 theOrder=251。 第 四 步 ， 顶 点 3 是 唯一 的 候选 ， 加 入 顶点 3 之 后 ， 
theOrder=2513。 最 后 两 步 分 别 加 入 顶点 4 和 6， 得 到 theOrder=251346。 

3. 贪 禁 算 法 的 正确 性 

为 保证 贪 禁 算 法 的 正确 性 ， 我 们 需要 证 明 : 1 ) 当 算 法 失败 时 ， 有 向 图 没有 拓扑 序列 ; 2 ) 
若 算法 没有 失败 ， 则 theOrder 是 一 个 拓扑 序列 。2 ) 使 用 贪 禁 准 则 选取 下 一 个 顶点 的 直接 结果 。 
对 1) 的 证 明 见 引 理 17-1。 它 证 明 ， 如 果 算 法 失败 ,那么 有 向 图 一 定 含有 环 路 。 假 设 一 个 环 
路 为 qqj+1…qiq;， 该 有 向 图 没有 拓扑 序列 ， 因 为 该 序列 表明 ， 任 务 qj 一 定 要 在 任务 g) 开始 
前 完成 。 

引 理 17-1 如 果 图 17-5 的 算法 失败 ， 则 有 向 图 含有 环 路 。 

证 明 当 算 法 失败 时 |theOrderl<n， 且 没有 候选 顶点 可 以 加 入 theOrder 中 。 因 此 至 少 有 一 
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个 顶点 qi 不 在 theOrder 中 。 这 时 有 向 图 至 少 包含 一 条 边 (9291 ) 且 9; 不 在 theOrder 中 ， 否 
则 ,gi 是 可 加 入 theOrder 的 候选 项 点 。 同 样 ， 必 有 一 条 ( q3,q2 ) 使 得 93 不 在 theOrder 中 。 若 
gs=q1， 则 g1q393 是 有 向 图 的 一 个 环 路 。 若 q3 关 91， 则 必 存 在 qs 使 (q4,93) 是 有 向 图 的 边 且 
gq4 不 在 theOrder 中 ， 否 则 ，g; 便 是 可 加 入 the Order 的 一 个 候选 顶点 。 若 qs 为 91,92,93 中 的 任 
何 一 个 ， 则 有 向 图 含有 环 。 因 为 有 向 图 的 顶点 数 n 是 有 限 数 ,继续 上 述 的 论证 ， 最 后 总 能 找 
到 一 个 环 路 。 画 

4. 数据 结构 的 选择 

为 了 将 图 17-5 简单 的 算法 细 化 到 C++ 代码 ,我们 必须 确定 序列 theOrder 的 表示 方 
法 ， 以 及 候选 项 点 的 选择 方法 。 如 果 用 一 个 一 维 数 组 表示 theOrder， 用 一 个 栈 来 保存 可 加 入 
theOrder 的 候选 顶点 ， 用 一 个 一 维 数组 inDegree， 其 中 inDegree[] 表示 不 在 theOrder 中 但 邻 
接 至 顶点 j 的 顶点 的 数目 。 当 inDegree1j] 变 为 0 时 ， 表 示 顶 点 7 成 为 一 个 候选 顶点 。 初 始 时 ， 
序列 theOrder 为 空 ，inDegree[ 就 是 顶点 j 的 入 度 。 每 次 向 序列 theOrder 加 入 一 个 顶点 时 ， 
所 有 邻接 于 该 项 点 的 项 点 j， 其 inDegreelj] 减 1。 

对 于 有 向 图 17-4， 开 始 时 inDegree[1:6]=[0,0,1,3,1,3]。 由 于 顶点 1 和 2 的 inDegree[0]= 
inDegree[1]=0， 因 此 顶点 1 和 2 是 可 加 入 theOrder 的 候选 顶点 ， 首 先 人 栈 。 每 一 步 从 栈 中 取 
出 一 个 顶点 加 入 theOrder 中 ， 同 时 对 邻接 于 该 顶点 的 顶点 ,将 其 inDegree 减 1。 如 果 第 一 步 
从 栈 中 取出 的 是 顶点 2， 并 将 其 加 入 theOrder， 则 theOrder[0]=2，inDegree[1:6]=[0,0,1,2,0,3]。 
因为 这 时 inDegree[5] 变 为 0， 所 以 将 顶点 $ 加 入 栈 。 

5. C++ 实现 

程序 17-2 的 函数 topologicalOrder 是 相应 的 C++ 代码 。 它 是 抽象 类 graph (程序 16-1 ) 的 
一 个 成 员 函 数 ， 对 于 加 权 有 向 图 和 无 权 有 向 图 均 适 用 。 如 果 找 到 拓扑 序列 ， 则 topologicalOrder 
方法 返回 tue， 且 将 拓扑 序列 存储 在 theOrder[0:n-1] 中 人 返回， 其 中 是 有 向 图 的 定点 数 。 如 果 
没有 找到 拓扑 序列 ， 则 返回 false。 


程序 17-2 拓扑 排序 
bool topologicalOrder (int *theOrder) 
{1/ 返回 false， 当 且 仅 当 有 向 图 没有 拓扑 序列 
1/ 如 果 存 在 一 个 拓扑 序列 ， 将 其 赋 给 theorder[0:n-1] 
1/ 这 里 有 一 段 确定 有 向 图 的 代码 


int n = numberOfVertices(); 


1/ 计算 入 度 
int *inDegree = new int [n+ 1]; 
fill(inDegree + 1, inDegree + n+ 1 0)»? 
GE (int 让 = 1; 4 = HW ++) 
{/ 顶点 i 的 出 边 
vertexIterator<T> *ii = iterator(i); 
主攻 
while {(u = ii=>next()) != 0) 


1 访问 顶点 二 的 一 个 邻接 点 
inDegree [ul]++; 
} 
/把 入 边 数 为 0 的 顶点 加 入 栈 
arrayStack<int> stack; 
for (int i = 1; 1 <= ny i++) 
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if (inDegree[il == 0) 
stack.push(i); 
/生成 拓扑 序列 
int j = 0; // 数 组 theorder 的 索引 
while (!stack.empty()) 


{1/ 从 栈 中 提取 顶点 
int nextVertex = stack.top(); 
stack.pop(); 
theOrder[j++] = nextVertex; 
1// 更 新 入 边 数 
vertexIterator<T> *iNextVertex = iterator (nextVertex); 
int u; 
while ((u = iNextVertex->next()) != 0) 


{// 访问 顶点 nextVertex 的 一 个 邻接 顶点 
inDegree [ul]--; 
if (inDegree[u] == 0) 
stack,push (u); 
} 
} 
return (j == n); 


} 


6. 复杂 性 分 析 

如 果 使 用 邻接 矩阵 描述 ， 第 一 个 for 循环 的 时 间 开 销 为 O02 ; 如 果 使 用 邻接 链表 描述 ， 
则 用 时 为 O(n+e)。 这 里 ，n 表示 有 向 图 的 项 点数 ，e 表示 边 数 。 第 二 个 for 循环 用 时 O(n)。 在 
两 个 垦 套 的 while 循环 中 ， 外 层 循 环 需 执行 n 次。 每 次 将 顶点 nextVertex 加 入 theOrder 中 ， 
并 初始 化 内 层 while 循环 。 使 用 邻接 矩阵 时 ， 内 层 while 循环 对 于 每 个 顶点 nextVertex 需 用 
时 O(n) ; 车 利用 邻接 链表 ， 则 这 个 循环 需 用 时 gos, ， 因 此 ， 内 层 while 循环 的 时 间 开 销 为 
O(n”) 或 O(n+e)。 结 果 ， 车 利用 邻接 矩阵， 程序 17-2 的 时 间 复 杂 性 为 O02， 若 利用 邻接 链 
表 ， 则 为 O(n+e)。 


17.3.4 ”二 分 覆盖 


1. 问题 描述 

二 分 图 ( 见 例 16-3 ) 是 一 个 无 向 图 ， 它 的 个 顶点 可 以 划分 为 两 个 集合 : 集合 4 和 集合 
8B， 使 任何 一 条 边 的 两 个 项 点 都 不 在 同一 个 集合 中 ( 即 任何 一 条 边 都 是 一 个 顶点 在 集合 4 中 ， 
另 一 个 在 集合 B 中 )。4 的 一 个 子 集 4' 覆盖 集合 B (或 简单 地 说 ，4' 是 一 个 覆盖 )， 当 且 仅 当 


B 的 每 个 项 点 至 少 与 4' 的 一 个 顶点 相连 。 和 覆盖 4' 的 大 小 即 为 4' 的 顶点 数目 。4' 是 最 小 覆盖 ， 
当 且 仅 当 4 没有 更 小 的 子 集 覆盖 B。 


例 17-10 考察 如 图 17-6 所 示 的 具有 17 个 顶点 的 二 分 图 。A4={1,2,3,16,17} 和 B={4,5,6,7, 
8,9,10,11,12,13,14,15} ， 子 集 4'={1,2,3,17} 覆盖 BB， 其 大 小 为 4。 子 集 4'={1,16,17} 也 覆盖 
B8， 大 小 是 3。4 没有 比 3 还 小 的 子 集 覆 盖 BB。 因此 ，A4'={1,16,17} 是 B 的 最 小 覆盖 。 四 

在 二 分 图 中 寻找 最 小 覆盖 的 问题 称 为 二 分 覆盖 (bipartite cover ) 问题 。 例 16-3 说 明 最 小 
覆盖 是 很 有 用 的 ， 因 为 它 能 确定 在 会 议 中 可 以 完成 翻译 任务 的 翻译 人 员 的 最 少数 量 。 二 分 履 
盖 问 题 类 似 于 集合 覆盖 ( set cover ) 问题 。 在 集合 覆盖 问题 中 ， 给 出 上 个 集合 S={S1,S2,…,Sx}， 
每 个 集合 5S; 中 的 元 素 均 是 全 集 U 中 的 成 员 。5 的 一 个 子 集 8' 覆盖 w， 当 上 且 仅 当 US =U。 8 
的 集合 数目 即 为 覆盖 的 大 小 。S' 是 最 小 覆盖 ， 当 上 且 仅 当 S$ 没有 和 覆盖 U 的 更 小 的 集合 。 可 以 将 
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集合 覆盖 问题 转化 为 二 分 覆盖 问题 (反之 亦 然 ): 用 4 的 顶点 表示 5 的 元 素 8 9 …, Si,B 的 
顶点 表示 U 的 元 素 。 一 个 边 的 顶点 分 别 在 4 和 B 中， 当 且 仅 当 与 UU 对 应 的 元 素 在 与 5 对 应 的 
子 集中 。 





图 17-6 例 17-10 的 图 


例 17-11 令 S={51…,Ss},，U={4,5,…,15}, S1={4,6,7,8,9,] 3}，S2={4,5,6,8}，S3={8,10,12,14,15}， 
54={5,6,8,12,14,15} ，Ss={ 4,9,10,11}。S' ={S1,5$4,Ss} 是 一 个 大 小 为 3 的 覆盖 。 没 有 更 小 的 覆盖 ， 
因此 S$' 即 为 最 小 覆盖 。 这 个 集合 覆盖 实例 可 映射 为 图 17-6 的 二 分 图 ,用 顶点 1，2，3，16 和 17 
分 别 表示 和 集合 S\,，S;，，53，S4 和 S;， 顶 点 j 表示 全 集中 的 元 素 j, 4 <j < 15。 国 

2. 贪 禁 启发 式 方法 

集合 覆盖 问题 为 NP- 复杂 问题 。 由 于 集合 覆盖 与 二 分 覆盖 是 同一 类 问题 ， 二 分 覆盖 问题 
也 是 NP- 复杂 问题 。 因 此 很 可 能 无 法 找到 一 个 快速 的 算法 来 解决 它 ， 但 是 可 以 利用 贪 禁 算 法 
寻找 一 种 快速 启发 式 方法 。 一 种 可 能 的 启发 式 方法 是 分 步 建 立 覆 盖 4'。 每 一 步 选择 4 的 一 个 
顶点 加 入 覆盖 4'。 选 择 的 贪 焚 准 则 : 从 4 中 选择 一 个 顶点 ， 它 最 大 数量 地 覆盖 了 B 中 还 未 被 
窗 盖 的 元 素 。 

例 17-12 考察 图 17-6 所 示 的 二 分 图 。 初 始 化 4' = 中 且 B 中 没有 顶点 被 覆盖 。 顶 点 1 和 
16 均 能 覆盖 了 中 6 个 未 覆盖 的 顶点 ， 顶 点 3 覆盖 5 个 ， 顶 点 2 和 17 分别 覆盖 4 个 。 因 此 ， 
第 一 步 往 4 中 加 入 顶点 1 或 16。 若 加 入 顶点 16， 则 它 覆 盖 的 顶点 为 {5,6,8,12,14,15}。 未 
覆盖 的 顶点 为 {4,7,9,10,11,13}。 硕 点 1 能 覆盖 其 中 4 个 顶点 ( {4,7,9,13} )， 顶 点 2 覆盖 一 个 
({4})， 顶 点 3 覆盖 一 个 (110} )， 顶 点 16 覆盖 零 个 ， 顶 点 17 覆盖 4 个。 第 一 步 可 选择 顶点 1 
或 17 加 入 4'。 若 选择 顶点 1， 则 仍 未 覆盖 的 顶点 为 {10,11}。 对 此 顶点 1、2 和 16 都 没有 覆 
盖 ， 顶 点 3 覆盖 一 个 ， 顶 点 17 覆盖 两 个 。 因 此 选择 顶点 17。 至 此 ， 所 有 顶点 都 被 覆盖 ， 得 
到 A4'={1,16,17}。 国 

图 17-7 简化 了 贪 禁 覆 盖 启 发 式 方 法 。 可 以 证 明 : 1 ) 算法 找 不 到 覆盖 ， 当 且 仅 当初 始 的 
二 分 图 没有 和 覆盖; 2 ) 二 分 图 存在 ， 但 启发 式 方法 可 能 找 不 到 二 分 图 的 最 小 覆盖 。 


4 = 中 
while ( 有 更 多 的 顶点 可 以 被 覆盖 ) 
把 一 个 顶点 加 入 4'， 这 个 顶点 最 大 数量 的 覆盖 未 覆盖 的 顶点 


if ( 有 一 些 顶 点 为 覆盖 ) 失败 
else 找到 一 个 覆盖 


图 17-7 贪 梦 覆 盖 启 发 式 方法 的 简化 





3. 数据 结构 的 选取 及 复杂 性 分 析 
为 实现 图 17-7 的 算法 ， 需 要 选择 4' 的 表示 方法 和 4 中 每 一 个 顶点 所 能 覆盖 B 中 未 覆 
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盖 的 顶点 的 数目 的 跟踪 记录 方法 。 因 为 对 集合 4' 仅 有 加 法 运算 ,所 以 可 用 一 维 整 型 数组 
theCover 来 描述 4'， 用 coverSize 来 跟踪 记录 4' 的 元 素 个 数 。 用 theCover[0:coverSize-1] 记录 
A' 的 成 员 。 

对 于 4 的 一 个 顶点 i,， 令 new; 为 项 点 i 所 能 覆盖 中 中 未 覆盖 的 顶点 的 数目 。 每 一 步 选择 
new; 值 最 大 的 顶点 ， 然 后 随 着 原来 未 被 覆盖 的 顶点 现在 被 覆盖 ， 需 要 更 新 new; 的 值 。 为 此 ， 
检查 B 中 新 近 被 v 覆盖 的 顶点 , 令 j 是 这 样 的 一 个 顶点 ， 则 4 中 所 有 覆盖 j 的 项 点 的 new; 值 
均 减 1。 

例 17-13 考察 图 17-6。 初 始 时 (newi,new2,new3,newie,new17)=(6,4,5,6,4)。 假 设 第 一 步 
选择 顶点 16， 像 在 例 17-12 中 一 样 。 这 时 ， 为 更 新 new; 的 值 ， 检 查 B 中 所 有 新 近 被 覆盖 的 顶 
点 ， 这 些 顶点 为 5,6,8,12,14 和 15。 当 检查 顶点 5 时 ， 将 news 和 newis 的 值 分 别 减 1， 因 为 顶 
点 5 不 再 是 被 顶点 2 和 16 覆盖 的 未 被 覆盖 节点 。 检 查 顶 点 6 时 ， 顶 点 newubnewa 和 newise 的 
值 分 别 减 1。 同 样 ， 检 查 顶 点 8 时 ， 顶 点 newi,new2,new3 和 new1s 的 值 分 别 减 1。 当 检查 完 所 
有 新 近 被 覆盖 的 顶点 ， 得 到 的 new; 值 为 (4，1，1，0，4 )。 下 一 步 选 择 顶点 1， 新 近 被 覆盖 
的 顶点 为 4，7，9 和 13。 检 查 顶 点 4 时 ，newi,new2 和 newi7y 的 值 减 1 ; 检查 顶点 7 时 ， 只 有 
newi 的 值 减 1， 因 为 顶点 1 是 覆盖 7 的 唯一 顶点 。 加 

为 了 实现 顶点 选取 的 过 程 ， 需 要 知道 new; 的 值 和 已 被 覆盖 的 顶点 。 为 此 可 用 两 个 一 维 数 
组 。newVerticesCovered 是 一 个 整 型 数组 ，newVerticesCovered[i 等 于 new;; covered 是 一 个 
布尔 型 数组 ， 若 顶点 i 未 被 覆盖 则 covered[i] 等 于 false， 否 则 covered[i] 等 于 true。 现 在 可 以 
把 图 17-7 的 简单 的 算法 细 化 为 图 17-8。 


coverSize=0; /当前 覆盖 的 大 小 
对 于 入 的 所 有 二，newVerticesCcovered[i]=degree[il] 
对 于 B 的 所 有 1i，covered[i]=false 
while ( 对 于 和 的 某 些 inewVerticesCovered [1]>0) 
{ 
设 V 是 newVerticesCovered[i] 值 最 大 的 顶点 
theCover [CoverSize++]=V7 
for ( 所 有 邻接 于 v 的 顶点 了) 
{ 
if(!covered[j]) 
{ 
Covered[j]=true; 
对 于 所 有 邻接 于 j 的 顶点 ， 使 其 newVerticesCovered[k] 减 1 
} 
} 


} 

if (有些 顶点 未 被 覆盖 ) 
失败 

else 


找到 一 个 覆盖 





图 17-8 图 17-7 的 细 化 


更 新 newVerticesCovered 的 时 间 为 O(e)， 其 中 为 二 分 图 的 边 数 。 车 使 用 邻接 和 矩阵 ， 则 
需 花 6(02) 的 时 间 来 寻找 图 中 的 边 ， 若 用 邻接 链表 ， 则 需 B@(n+e) 的 时 间 。 实 际 更 新 时 间 是 
O02) 或 O(n+e)， 具体 是 哪 一 个 ， 要 根据 描述 方法 而 定 。 
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在 每 一 步 开 始 阶段 ， 选 择 顶 点 所 需 时 间 为 @(SizeOfA)， 其 中 SizeOfA=I4|。 因 为 4 的 
所 有 顶点 都 有 被 选择 的 可 能 ， 所 以 所 需 步 骤 数 为 O(SizeOfA)， 而 且 履 盖 算 法 总 的 复杂 性 为 
O(SizeOfA?+n")=O(n”) 或 O(SizeOfA*+n+te)。 

4. 降低 复杂 性 

使 用 存储 new; 值 的 有 序数 组 、 大 根 堆 或 最 大 选择 树 (max selection tree )， 可 将 每 步 
开始 阶段 选取 顶点 v 的 复杂 性 降 为 86(1)。 若 使 用 有 序数 组 ， 则 在 每 步 的 最 后 阶段 ， 都 要 
对 new, 值 进行 重新 排序 。 若 使 用 箱子 排序 ( 见 6.5.1 节 )， 则 排序 时 间 为 9(SizeOfB)， 其 中 
SizeOfB=|8|。 一 般 SizeOfB 比 SizeOfA 大 得 多 ， 因 此 有 序数 组 并 不 能 提高 总 的 性 能 。 

若 使 用 大 根 堆 ， 则 每 一 步 都 需要 重新 建 堆 来 记录 newVerticesCovered 的 值 的 变化 。 我 们 
可 以 在 每 次 newVerticesCovered 值 减 1 的 时 候 重建 堆 。 这 样 的 话 ， 被 减 的 newVerticesCovered 
值 最 多 在 堆 中 向 下 移动 一 层 ， 因 此 每 次 重建 堆 所 需 时 间 为 6(1)。 减 操作 的 总 数 为 O(e)。 因 此 
在 算法 的 所 有 步骤 中 ， 维 持 大 根 堆 仅 需 时 间 为 O(e)。 结 果 是 利用 大 根 堆 实现 覆盖 算法 的 总 复 
杂 性 为 O(n”) 或 O(nte)。 

若 使 用 最 大 选择 树 ， 则 每 次 更 新 newVerticesCovered 的 值 之 后 需要 重建 选择 树 ， 所 需 时 
间 为 9(log SizeOfA)。 重 建 的 最 好 时 机 是 在 每 步 结 束 时 ， 而 不 是 在 每 次 newVerticesCovered 值 
减 1 时 。 需 要 重建 的 次 数 为 O(e)， 因 此 总 的 重建 时 间 为 Ole log SizeOfA)。 这 个 时 间 比 大 根 堆 
的 重建 时 间 要 长 。 

然而 ， 使 用 “ 装 有 ”newVerticesCovered 的 值 相同 的 顶点 的 箱子 ， 也 可 获得 使 用 大 根 堆 
时 的 时 间 性 能 。 因 为 newVerticesCovered 的 取 值 范围 从 0 到 SizeOfB， 所 以 需要 SizeOfB+1 个 
箱子 。 每 个 箱子 i 都 是 一 个 双向 链表 ， 链 接 所 有 newVerticesCovered 值 为 i 的 顶点 。 在 某 一 步 
结束 时 ， 例 如 ， 若 newVerticesCovered[6] 从 12 变 到 4， 则 需要 将 它 从 第 12 个 箱子 移 到 第 4 
个 箱子 。 利 用 模拟 指针 和 一 个 顶点 数组 node (node[i] 代表 顶点 i,，node[i].left 和 node[i].right 
为 双向 链表 指针 )， 为 了 将 顶点 6 从 第 12 个 箱子 移 到 第 4 个 箱子 ， 我 们 从 第 12 个 箱子 中 删 
除 node[6] 并 将 其 插入 第 4 个 箱子 。 利 用 这 种 箱子 模式 ， 覆 盖 启 发 式 算 法 的 复杂 性 为 O(n”) 或 
O(z+e)， 具 体 是 哪 一 个 ， 取 决 于 描述 方法 是 邻接 矩阵 还 是 邻接 表 。 

把 图 17-8 细 化 可 以 得 到 C++ 代码 ， 它 使 用 带 有 模拟 指针 的 双向 链表 来 表示 箱子 。 这 个 
代码 ， 作 为 方法 graph::bipartiteCover， 可 以 从 本 书 网 站 上 得 到 。 


17.3.5 ” 单 源 最 短路 径 


1. 问题 描述 

给 定 一 个 加 权 有 向 图 G， 它 的 每 条 边 (i,j ) 都 有 一 个 非 负 的 成 本 (或 长 度 ) ali][。 一 
条 路 径 的 长 度 是 该 路 径 所 有 边 的 成 本 之 和 。 图 17-9a 是 一 个 5 个 顶点 的 加 权 有 向 图 。 每 一 
条 边 上 的 数值 是 它 的 成 本 。 路 径 1,2,5 的 长 度 9。 路 径 1,5 的 长 度 是 8。 路 径 1,3,4,5 的 长 度 
是 6。 

寻找 一 条 从 一 个 给 定 的 源 项 点 出 发 到 达 其 他 任意 一 个 顶点 ( 称 为 目的 项 点 ) 的 最 短路 径 。 
图 17-9a 给 出 了 一 个 5 个 顶点 的 有 向 图 ， 图 17-9b 给 出 了 从 源 顶 点 1 出 发 的 所 有 最 短路 径 ; 这 
些 路 径 按 路 径 长 度 递 增 顺 序 排 列 ， 每 条 路 径 前 面 的 数字 表示 路 径 的 长 度 。 

2. 贪 禁 法 求解 

利用 E.Dijkstra 发 明 的 贪 禁 算 法 ， 可 以 分 步 生成 最 短路 径 。 每 一 步 产生 一 个 到 达 新 的 目 
的 顶点 的 最 短路 径 。 每 一 条 最 短路 径 的 目的 顶点 的 选择 方法 依据 如 下 贪 焚 准 则 : 从 一 条 最 短 
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路 径 还 没有 到 达 的 顶点 中 ， 选 择 一 个 可 以 产生 最 短路 径 的 目的 顶点 。 也 就 是 说 ，Dijkstra 的 方 
法 按 路 径 长 度 的 递增 顺序 产生 最 短路 径 。 


从 下 全 ED 


a) 图 b) 最 短路 径 
图 17-9 最 短路 径 举例 


我 们 在 开始 时 的 第 一 条 路 径 是 从 源 顶 点 到 它 自身 的 平凡 路 径 ， 这 条 路 径 没有 边 ， 长 度 为 
0。 在 贪 焚 算 法 的 每 一 步 ， 产 生 下 一 条 最 短路 径 。 这 条 路 径 是 在 一 条 已 产生 的 最 短路 径 上 加 入 
一 条 可 行 的 边 而 得 到 的 ( 练习 31 )。 以 图 17-9b 为 例 ， 第 二 条 路 径 是 在 第 一 条 路 径 上 加 一 条 
边 ; 第 三 条 路 径 是 在 第 二 条 路 径 上 加 一 条 边 ; 第 四 条 路 径 是 在 第 一 条 路 径 上 加 一 条 边 ; 第 五 
条 路 径 是 在 第 三 条 路 径 上 加 一 条 边 。 

通过 上 述 观 察 可 以 得 到 一 种 简便 的 方法 来 存储 最 短路 径 。 使 用 数组 predecessor， 
令 predecessor[i 是 从 源 顶 点 到 达 顶 点 i 的 路 径 中 顶点 ji 前面 的 那个 顶点。 在 本 例 中 ， 
predecessor[1:5]=[0,1,1,3,4]。 从 顶点 sourceVertex 到 顶点 i 的 路 径 可 以 从 顶点 i 反 向 生成 ， 沿 着 序 
列 predecessor[i]，predecessor[predecessor[i]]，predecessor[predecessor[predecessor[i]]]，… 直 至 到 达 顶 
点 sourceVertex。 在 本 例 中 ， 如 果 从 i=5 开始 ， 则 顶点 序列 为 predecessor[i]=4，predecessor[4]=3， 
predecessor[3]=1=sourceVertex。 因 此 路 径 为 1，3，4，5。 

为 了 便于 按 长 度 递增 顺序 产生 最 短路 径 ， 我 们 定义 distanceFromSource[i] 是 在 已 生 
成 的 最 短路 径 上 扩展 一 条 最 短 边 从 而 到 达 顶 点 ii 时 这 条 最 短 边 的 长 度 。 最 初 ， 仅 有 一 条 从 
sourceVertex 到 sourceVertex 的 路 径 ， 长 度 为 0。 这 时 对 每 个 顶点 1i，distanceFromSource[j] 等 
于 a[sourceVertex][i] (a 是 有 向 图 的 成 本 邻接 矩阵 )。 为 产生 下 一 条 路 径 ， 需 要 选择 一 个 还 没 
有 一 条 最 短路 径 到 达 的 项 点。 在 这 些 顶 点 中 ,使 distanceFromSource[] 的 值 最 小 的 顶点 是 下 一 
条 路 径 的 终点 。 当 得 到 一 条 新 的 最 短路 径 之 后 ， 有 些 顶 点 的 distanceFromSource[] 值 可 能 会 改 
变 ， 因 为 由 新 的 最 短路 径 进 行 扩 展 可 能 产生 更 小 的 值 。 

3. Dijkstra 贪 禁 算法 的 伪 码 

综 上 所 述 ， 我 们 得 到 算法 的 简化 ， 如 图 17-10 所 示 。1 ) 对 所 有 邻接 于 顶点 sourceVertex 
的 顶点 ， 将 predecessor 初始 化 为 sourceVertex。 这 个 初始 化 记录 了 当前 最 有 用 的 信息 。 这 时 
从 sourceVertex 到 i 的 最 短路 径 是 由 sourceVertex 到 它 自身 的 最 短路 径 再 扩充 一 条 边 得 到 的 。 
当 找 到 更 短 的 路 径 时 ，predecessorfi] 的 值 将 被 更 新 。 当 找到 下 一 条 最 短路 径 时 ， 需 要 根据 路 
径 的 扩充 边 来 更 新 distanceFromSource 的 值 ( 步骤 4 ))。 表 newReachableVertices 包含 所 有 从 
sourceVertex 可 以 到 达 的 顶点 ， 也 是 要 生成 的 最 短路 径 所 到 达 的 顶点 。 

4. 数据 结构 的 选择 和 复杂 性 分 析 

我 们 需要 为 表 newReachableVertices 选择 一 个 数据 结构 。 从 这 个 表 中 ,我 们 需要 提取 
distanceFromSource 值 最 小 的 顶点 (步骤 3 )。 如 果 distanceFromSource 用 小 根 堆 ( 见 12.4 节 ) 
来 表示 ,那么 这 种 提取 算法 可 在 对 数 时 间 内 完成 。 由 于 步骤 3 ) 的 执行 次 数 为 O(n)， 所 以 该 
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步骤 需要 用 时 O(nlogn)。 然 而 在 步骤 4)， 我 们 可 能 需要 改变 一 些 distanceFromSource 的 值 ， 
因为 对 为 到 达 的 顶点 ， 新 扩展 的 最 短路 径 可 能 使 相应 的 distanceFromSource 值 更 小 。 虽 然 减 
操作 并 不 是 标准 的 小 根 堆 操作 ， 但 它 能 在 对 数 时 间 内 完成 。 由 于 执行 减 操 作 的 总 次 数 为 O( 有 
向 图 中 的 边 数 )=O(02)， 所 以 执行 减 操作 的 总 时 间 为 O(rlogn)。 


” 1 ) 初始 化 distanceFromSource[i]=a[sourceVertex][i] (1 i<n) 
对 所 有 邻接 于 sourceVertex 的 顶点 1i， 令 predecessor[i]=sourceVertex 
对 所 有 其 他 顶点 ，predecessor[sourceVertex]=0 上 且 predecessor[i]=-1 
创建 一 个 表 newReachableVertices、 存 储 所 有 predecessorfi]>0 的 顶点 ( 即 这 个 表 包 含 所 有 邻接 于 sourceVertex 
的 顶点 )。 


2 ) 如 果 newReachableVertices 为 空 ， 算 法 停止 。 否 则 ， 转 至 3 )。 

3 ) 从 newReachableVertices 中 删除 distanceFromSource 值 最 小 的 顶点 i。 

4) 对 所 有 邻接 于 顶点 i 的 顶点 j)， 将 distanceFromSource[j] 更 新 为 min{distanceFromSource[j], distance- 
FromSource[i]+afi][]}。 如 果 distanceFromSource[j] 改变 ， 令 predecessor[j]=i， 而 且 ， 若 j 没有 在 表 newReachable- 
Vertices 中 ， 则 将 其 加 入 进去 。 





图 17-10 Dijkstra 的 最 短路 径 算法 的 简化 


若 用 无 序 链表 来 表示 newReachableVertices， 则 步骤 3 ) 与 4) 的 用 时 为 O(n”)。 现 在 , 步 
又 3) 的 每 一 次 执行 需 用 时 O(InewReachableVertices|)=O(n)， 而 每 一 次 减 操作 需 用 时 @(1)。 
( distanceFromSource[j] 的 值 需 要 减少 ， 但 链表 不 用 改变 。) 

5. C++ 实现 

将 图 17-10 的 伪 代 码 细 化 为 程序 17-3 的 C++ 方法 adjacencyWDigraph::shortestPaths。 这 
个 代码 使 用 了 类 graphChain ( 见 16.7.3 节 )。 


程序 17-3 ”最短 路径 程序 


void shortestPaths (int sourceVertex, T* distanceFromSource, int* predecessor) 
{1// 寻找 从 源 sourceVertex 开始 的 最 短路 径 
/在 数组 distanceEromSource 中 返回 最 短路 径 
// 在 数组 predecessor 中 返回 顶点 在 路 径 上 的 前 驱 的 information 
if (sourceVertex < 1 || sourceVertex > n) 
throw illegalParameterValue ("Invalid source vertex"); 


// 这 里 确认 *this 是 加 权 图 的 代码 


graphChain<int> newReachableVertices; 


/初始 化 
or (nt 注 寺 ly = DY Lt) 
{ 
distanceFromSource[i] = al[lsourceVertex] [il]; 
if (distanceFromSource[i] == noEdge) 
predecessor[i] = -1; 
else 
{ 
predecessor[i] = sourceVertex; 


newReachableVertices.insert (0, i); 
} 
} 
distanceFromSource[sourceVertex] = 0; 
predecessor[sourceVertex] = 0; // 源 顶点 没有 前 驱 


1/ 更 新 distanceFromSource 和 predecessor 
while (!newReachableVertices.empty()) 
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{1/ 还 存在 更 多 的 路 径 
// 寻找 distanceFromSource 和 值 最 小 的 ， 还 未 到 达 的 顶点 v 
chain<int>::iterator iNewReachableVertices= newReachableVertices.begin(); 
chain<int>::iterator theEnd = newReachableVertices.end(); 
int v = *iNewReachableVertices; 
iNewReachableVerticest++; 
while (iNewReachableVertices != theEnd) 
{ 
int w = *iNewReachableVertices; 
iNewReachableVerticest++; 
if (distanceFromSource[w] < distanceFromSource[v]) 
V = wi? 


} 


// 下 一 条 最 短路 径 是 到 达 顶 点 v 
// 从 newReachableVertices 删除 顶点 VvV， 然 后 更 新 dijstanceFromSource 
newReachableVertices.eraseElement (V) : 
for (int J = 17 1 <= n; 了 t+) 
{ 

if (a[lv] [jj] != noEdge && (predecessor[j] == -1 || 
distanceFromSource[j] > distanceFromSource[v] + al[lv][j])) 

{ 

/1/1distanceFromSource[j] 减少 


distanceFromSource[j] = distanceFromSource[v] + al[lv][j]; 
/把 顶点 j 加 到 newReachableVertices 

if {predecessor[j] == -1) 

/ 以 前 未 到 达 


newReachableVertices.insert (0, j); 
predecessor[j]l=vV; 


} 


6. 复杂 性 评价 

程序 17-3 的 复杂 性 是 0(m)。 任 何 一 个 最 短路 径 算法 对 每 一 条 边 都 至 少 检查 一 次 ， 因 为 
任何 一 条 边 都 可 能 在 最 短路 径 中 。 因 此 这 种 算法 的 最 小 可 能 时 间 为 O(e)。 既 然 使 用 成 本 邻接 
矩阵 来 描述 图 ， 那 么 仅仅 决定 哪些 边 属 于 有 向 图 就 需 O(02) 的 时 间 。 因 此 ， 任 何 最 短路 径 算 
法 ， 只 要 用 邻接 矩阵 来 描述 ， 都 需要 O(2) 的 时 间 。 不 过 程序 17-3 作 了 优化 ( 常数 因子 级 )。 
即使 改 用 邻接 表 ， 也 只 会 使 最 后 一 个 for 循环 的 总 时 间 降 为 O(e)( 因为 只 有 对 邻接 于 i 的 顶点 ， 
distanceFromSource 值 才 会 改变 )。 而 从 表 newReachableVertices 中 选择 和 删除 最 小 距离 顶点 
所 需 时 间 仍 然 是 O(n 7)。 


17.3.6 最 小 成 本 生成 树 


最 小 成 本 生成 树 问 题 在 例 16-2 和 例 17-3 中 已 考 察 过 。 因 为 在 n 个 项 点 的 无 向 网 络 G 中 ， 
每 棵 生成 树 都 刚好 有 n-1 条 边 ， 所 以 现在 的 问题 是 如 何 选择 n-1 条 边 使 它们 形成 G 的 最 小 成 
本 生成 树 。 为 此 ， 我 们 可 以 精确 地 描述 至 少 三 种 不 同 的 贪 禁 策略 。 这 些 策略 产生 了 最 小 成 本 
生成 树 的 三 个 算法 : Kruskal 算法 、Prim 算法 和 Sollin 算法 。 

1. Kruskal 算法 

(1) 算法 思想 

Kruskal 算法 分 步骤 选择 n-1 条 边 ， 每 步 选择 一 条 边 ， 所 依据 的 贪 焚 准 则 是 : 从 剩 下 的 
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边 中 选择 一 条 成 本 最 小 且 不 会 产生 环 路 的 边 加 入 已 选择 的 边 集 。 注 意 ， 一 个 含有 环 路 的 边 集 
不 可 能 形成 一 棵 生成 树 。Kruskal 算法 分 e 步 ， 其 中 e 是 网 络 中 边 的 数目 。 它 按 成 本 递增 顺序 
考察 e 条 边 ， 每 步 考察 一 条 边 。 当 考察 一 条 边 时 ， 如 果 这 条 边 加 入 已 选 的 边 集 中 会 产生 环 路 ， 
则 将 其 抛弃 ， 否 则 ， 将 它 加 入 已 选 入 的 边 集 中 。 

考查 图 17-11a 的 网 络 。 开 始 时 没有 选择 任何 边 。 图 17-11b 显示 了 当时 的 布局 。 第 一 步 选 
择 边 ( 1,6 )， 并 将 它 加 入 正在 构建 的 生成 树 中 ， 得 到 图 17-11c。 下 一 步 选择 边 ( 3,4 )， 并 将 它 
加 入 树 中 ， 得 到 图 17-11d。 然 后 选择 的 是 边 ( 2,7 )， 将 它 加 入 树 中 ， 得 到 图 17-11e。 接 下 来 
考察 边 ( 2.3 )， 并 将 其 加 入 树 中 ， 如 图 17-11f 所 示 。 在 其 余 还 未 考虑 的 边 中 ，( 7,4 ) 的 成 本 最 
小 ， 但 是 加 入 树 中 会 产生 环 路 ， 因 此 丢弃 。 接 下 来 将 边 ( 5,4 ) 加 入 树 中 ， 得 到 如 图 17-11g 所 
示 的 布局 。 然 后 考察 边 (7,5 )， 因 为 它 会 产生 环 路 ， 所 以 其 丢弃 。 最 后 考察 ( 6,5 ) 并 将 其 加 
人 树 中 ,产生 了 一 棵 生成 树 ， 如 图 17-11h 所 示 ， 其 成 本 为 99。 
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图 17-11 构造 最 小 成 本 生成 树 
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图 17-12 给 出 了 Kruskal 算法 的 伪 代 码 。 

(2 ) 正确 性 证 明 

我 们 需要 证 明 : 1 ) 只 要 存在 生成 树 ，Kruskal 1/ 在 nn 个 顶点 的 网 络 中 寻找 一 棵 最 小 成 本 生成 树 
算法 总 能 产生 一 棵 生成 树 ; 2 ) 产生 的 生成 树 具有 令 了 是 选 定 的 边 集 。 初 始 时 T= 9 


令 巨 是 网 络 的 边 集 
SA while(E # ¢§ )&&(|T| #¥ 1-1) 
令 G 为 任意 一 个 加 权 无 向 图 ( 即 G 是 一 个 : | 
无 向 网 络 )。 从 16.9.3 节 可 知 ， 一 个 无 向 图 有 一 令 (uv) 是 中 一 条 成 本 最 小 的 边 


棵 生成 树 ， 当 且 仅 当 这 个 无 向 图 是 连通 的 。 在 | 全 人 
Kruskal 算法 中 被 丢弃 的 边 ， 仅 仅 是 那些 产生 环 he 

路 的 边 。 而 在 连通 图 的 一 个 环 路 上 删除 一 条 边 ， } 

结果 仍 是 连通 图 。 因 此 如 果 G 在 开始 时 是 连通 | WD i 

的 ， 则 了 和 的 边 总 能 形成 一 个 连通 图 。 也 就 是 | ~ 

说 ， 如 果 G 开始 时 是 连通 的 ， 那 么 算法 终止 时 ， 网 络 不 连通 ， 没 有 生成 树 

不 会 出 现 E=g 和 |Tl<n-1。 

现在 我 们 证 明 ， 由 算法 所 得 到 的 生成 树 7 具 I 
有 最 小 成 本 。 既 然 G 具有 有 限 棵 生成 树 ， 那 么 它 至 少 具有 一 棵 最 小 成 本 生成 树 。 邻 minTrees 
是 G 的 最 小 成 本 生成 树 的 集合 。 对 任意 一 个 矿 E minTrees, 令 dw 是 属于 7T 且 属于 WV 的 边 的 
数量 。 令 k=max{dmlVE minTrees}，k<n-1。 如 果 上 rn-1， 则 TE minTrees。 因 此 假设 k<n- 
1。 现 在 用 反 证 法 证 明 。 

今 UE minTrees 且 dv=k。 从 7 中 取出 一 条 边 e 加 入 U， 从 UU 中 删除 一 条 边 f。e 和 了/ 按 
照 如 下 方式 选择 : 

1 ) 令 e 是 属于 了 7 而 不 属于 了 忌 的 成 本 最 小 的 边 。 因 为 k<n-1， 所 以 这 种 边 肯 定 存在 。 

2 ) 如 果 把 e 加 入 UU， 会 形成 唯一 的 一 条 环 路 。 令 f 是 这 条 环 路 上 不 属于 了 的 任意 一 条 
边 。 注 意 ， 因 为 了 没有 环 路 ， 所 以 这 条 环 路 至 少 有 一 条 边 不 属于 7。 

从 e 与 1 的 选择 方法 中 可 以 看 出 ， 三 U+{e}-{ 办 是 一 棵 生成 树 ， 且 7 中 恰 有 村 1 条 边 属于 
V。 现在 如 果 能 够 证 明 广 是 最 小 成 本 生成 树 ， 那 么 就 得 到 一 个 和 假设 k=max{ddW E€ minTrees} 
的 矛盾 ， 由 此 证 明 了 是 最 小 成 本 生成 树 。 

显然 , 玫 的 成 本 等 于 习 的 成 本 加 上 边 e 的 成 本 再 减 去 边 /的 成 本 。 若 e 的 成 本 小 于 了 的 成 
本 ， 则 生成 树 瑚 的 成 本 小 于 忌 的 成 本 ， 这 是 不 可 能 的 ， 因 为 局 是 最 小 成 本 生成 树 。 

如 果 e 的 成 本 大 于 j 的 成 本 ， 那 么 Kruskal 算法 一 定 在 e 之 前 考察 了 f。 既然 f 不 在 TT 中 ， 
那么 Kruskal 算法 在 考察 1 能 否 加 入 7T 时 将 f 丢 充 。 因 此 在 7 中 ,那些 成 本 小 于 或 等 于 f 的 成 
本 的 边 和 边 f 形 成 环 路 。 而 根据 e 的 选择 方法 ，e 是 一 条 属于 7 而 不 属于 U 的 成 本 最 小 的 边 ， 
因此 在 7 中 ， 所 有 成 本 小 于 e 的 成 本 的 边 ， 进 而 ， 所 有 成 本 小 于 7 的 成 本 的 边 ， 也 都 在 U 中 。 
这 样 一 来 ， 忆 必然 含有 环 路 ， 但 这 是 不 可 能 的 ， 因 为 U 是 一 棵 生成 树 。 所 以 假设 不 成 立 。 

现在 剩 下 唯一 的 可 能 是 : e 和 具有 相同 的 成 本 。 因 此 上 和 忆 具 有 相同 的 成 本 ， 即 天 是 
一 棵 最 小 生成 树 。 

(3 ) 数据 结构 的 选择 及 复杂 性 分 析 

为 了 按 成 本 非 递减 顺序 选择 边 ， 可 以 建立 小 根 堆 ， 然 后 根据 需要 从 堆 中 一 条 边 一 条 边 地 
提取 。 若 图 有 e 条 边 ， 则 堆 的 初始 化 需要 用 时 O(e)， 一 条 边 的 提取 需要 用 时 O(loge)。 

边 的 集合 7 了 与 G 的 顶点 一 起 定义 了 一 个 由 至 多 个 连通 子 图 构成 的 图 。 每 个 子 图 用 该 子 
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图 的 顶点 集合 来 描述 。 这 些 顶 点 集合 没有 公共 顶点 。 为 了 确定 边 (u,v) 是 否 会 产生 环 路 ， 
仅 需 检查 x、v 是 否 属于 同一 个 顶点 集 ( 即 处 于 同一 子 图 )。 如 果 是 ， 则 会 产生 一 个 环 路 ; 如 
果 不 是 ， 则 不 会 产生 环 路 。 因 此 ， 对 顶点 集 使 用 两 次 find 操作 就 可 以 了 。 当 把 一 条 边 加 到 
了 中 时 ， 两 个 子 图 被 合并 成 一 个 子 图 ， 即 对 两 个 集合 执行 unite 操作 。 对 集合 的 操作 find 和 
unite， 若 用 11.9.2 节 的 树 方法 (以 及 加 权 规 则 和 压缩 路 径 ) 来 实现 ， 则 效率 很 高 。find 操作 
的 次 数 最 多 为 2e，unite 操作 的 次 数 最 多 为 n-1 ( 车 加 权 无 向 图 是 连通 的 ， 则 刚好 是 n-1 次 )。 
还 有 树 的 初始 化 时 间 ， 其 复杂 性 略 大 于 O(n+e)。 

集合 了 的 唯一 操作 是 向 了 中 加 入 新 边 。7 可 用 数组 spanningTreeEdges 来 实现 ， 把 新 边 加 
入 数组 的 一 端 。 因 为 最 多 加 入 n-1 条 边 ， 所 以 了 的 操作 总 时 间 为 O(n)。 

把 上 述 各 个 部 分 的 执行 时 间 总 计 ， 得 到 图 17-12 算法 的 渐 近 复杂 性 O(n+teloge)。 

(4 ) C++ 实现 

利用 刚刚 描述 的 数据 结构 ， 可 以 把 图 17-12 细 化 为 C++ 代码， 如 程序 17-4 所 示 。 其 中 
的 方法 是 graph 类 的 一 个 成 员 ， 而 且 可 用 于 一 个 加 权 无 向 图 的 任何 描述 。 类 weightedEdge<T> 
定义 了 一 个 向 数据 类 型 T 的 类 型 转换 。 这 个 类 型 转换 的 返回 值 是 边 上 的 权 。 因 此 ， 边 是 按照 
权 的 递增 顺序 从 小 根 堆 中 提取 的 。 

如 果 不 存在 生成 树 ， 程 序 17-4 代码 的 返回 值 是 false， 和 否则 返回 true。 这 时 ， 一 个 最 小 成 
本 生成 树 在 数组 spanningTreeEdges 中 返回 。 


程序 17-4 ” Kruskal 算法 的 C++ 代码 


bool kruskal (weightedEdge<T> *spanningTreeEdges) 

{/ 使 用 Kruskal 方法 寻找 一 棵 最 小 成 本 生成 树 

/返回 false， 当 且 仅 当 加 权 无 向 图 是 不 连通 的 

// 算法 结束 时 ，spanningTreeEdges[0:n-2] 存储 的 是 最 小 成 本 生成 树 的 边 


/ 确定 *this 是 否 为 无 向 加 权 图 的 代码 在 此 省 略 


int n = numberOfVertices(); 
int e = numberOfEdges (); 

// 建立 一 个 数组 ， 存 储 边 

weightedEdge<T> *edge = new weightedEdge<T> [e + 1]; 


int k = 0; /数组 edge[] 的 索引 
for (int 主 三 1 1 <= nH 4+) 
{1/ 取 所 有 关联 至 i 的 边 
vertexIterator<T> *ii = iterator (i); 
1 洁 半 
T we 
while ((] = ii->next(w)) != 0) 
if (i < jj) /W/ 向 数组 中 加 一 条 边 
edge[++k] = weightedEdge<int> (i, j, w); 
} 
/把 边 插入 小 根 扒 


minheap<weightedEdge<T> > heap (1); 
heap.initialize (edge, e); 


fastUnionFind uf (n); /union/find 结构 
/ 按照 权 的 递增 顺序 提取 这 ， 然 后 决定 选 入 或 舍弃 
k = 0; /用 于 索引 


while (e >0 gg& k<n- 1) 
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{1/ 生成 树 没有 完成 且 还 有 边 存 在 
weightedEdge<T> x = heap.top(); 
heap .pop (); 

e 一 一 7 

int a = uf.find(x.vertexl()):; 

int b = uf.find(x.vertex2 ()); 

if (a != b) 

{// 选取 边 x 
spanningTreeEdges[k++] = x; 
uf.unitel(a,b),; 

} 

} 


return (k == n - 1); 


} 


2. Prim 的 算法 

与 Kruskal 算法 类 似 ，Prim 算法 通过 分 步 选 
边 来 创建 最 小 生成 树 ， 而 且 一 步 选 择 一 条 边 。 每 
步 选 边 所 依据 的 贪 禁 准 则 是 : 从 剩余 的 边 中 ， 选 
择 一 条 成 本 最 小 的 边 ， 并 且 把 它 加 入 已 选 的 边 集 
中 形成 一 棵 树 。 因 此 ， 每 一 步 所 得 的 入选 边 集 都 
形成 一 棵 树 。 相 反 ， 在 Kruskal 算法 中 ， 每 一 步 
所 得 入 选 的 边 集 都 是 一 个 森林 。 

Prim 算 法 从 一 棵 树 T 开 始 ， 它 只 有 一 个 顶 
点 。 这 个 顶点 可 以 是 原 图 中 任意 一 个 顶点 。 然 
后 把 一 条 成 本 最 小 的 边 (u, v) 加 入 7 中 ,使 
TU {(u, )} 也 是 一 棵 树 。 这 种 步骤 反复 执行 ， 
直到 TT 有 n-1 条 边 。 注 意 ， 在 选择 边 (u,v ) 时 ， 
顶点 wu 和 v 只 有 一 个 顶点 属于 7T。Prim 算法 的 简 
化 如 图 17-13 所 示 。 根 据 算法 描述 ， 输 入 的 图 不 
必 是 连通 的 。 这 时 就 没有 生成 树 。 图 17-14 显示 


// 假设 网 络 最 少 有 一 个 顶点 


令 T 是 入选 的 边 集 。 初 始 化 T= 

令 TV 是 已 在 树 中 的 顶点 集 。 置 TV={1} 

令 EE 是 网 络 的 边 集 

while(E #¢6 )&&(|T # 1-1) 

{ 

令 (uv) 是 一 条 成 本 最 小 的 边 , 且 wuE7TV, v&7TV 
if( 没有 这 样 的 边 ) 
终止 循环 
=E-{(u,y)} /从 五 中 删除 边 (u,v) 
把 边 (wy) 加 入 了 

把 顶点 v 加 入 TV 

} 

if(|7]==n-1) 

T 是 一 棵 最 小 成 本 生成 树 

else 


网 络 不 连通 ， 没 有 生成 树 





图 17-13 Prim 最 小 生成 树 算法 


了 对 图 17-11a 应 用 Prim 算法 的 过 程 。 把 图 17-13 细 化 为 C++ 的 程序 及 其 正确 性 证 明 留 作 练 
习 (练习 37 )。 

如 果 根 据 每 个 不 属于 TV 的 顶点 v 选 择 一 个 顶点 near(v)， 使 得 near(v) E 7 大 上 且 cost 
(vnear(v)) 的 值 最 小 ， 那 么 实现 Prim 算法 的 时 间 复 杂 性 为 O(n*)， 且 下 一 条 加 入 7 的 边 是 
(v,near(v) )。 

3. Sollin 算法 

Sollin 算法 的 每 一 步 都 选择 若干 条 边 。 在 每 一 步 的 开始 阶段 ， 所 选择 的 边 和 图 的 个 
顶点 一 起 构成 一 个 生成 树 的 森林 。 在 每 一 步 的 中 间 ， 为 森林 的 每 棵 树 选 择 一 条 边 ， 这 条 边 
成 本 最 小 ， 且 仅 有 一 个 顶点 在 该 树 中 。 将 这 条 边 加 入 正在 创建 的 生成 树 中 。 注 意 ， 可 能 为 
森林 的 两 棵 树 选 择 了 同一 条 边 ， 这 时 必须 去 除 重复 的 边 。 当 若干 条 边 具 有 相同 的 成 本 时 ， 
两 棵 树 可 以 选择 不 同 的 边 。 在 这 种 情况 下 ， 必 须 放弃 一 条 选择 的 边 。 在 第 一 步 的 开始 阶段 ， 
所 选择 的 边 集 为 空 。 若 在 某 一 步 结 束 时 仅 剩 下 一 棵 树 ， 或 已 经 没有 剩余 的 边 可 供 选 择 时 ， 
算法 终止 。 
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图 17-14 ”Prim 算法 的 步 又 


图 17-15 是 把 Sollin 算法 应 用 于 图 17-11a 时 的 步 又。 初始 时 ， 人 入选 边 集 为 空 ， 与 图 17-11b 
所 示 的 格局 一 样 。 生 成 树 森 林 的 每 棵 树 都 只 有 一 个 顶点 。 
根据 顶点 1,2…,7 所 选择 的 边 分 别 是 (1,6)，(2,7)，(3,4)， 
(4,3)，(5,4)，(6,1)，(7,2)。 在 所 选 的 边 集 中 不 同 的 边 是 
(1,6)，(2,7)，(3,4) 和 (5,4)。 将 这 些 边 加 入 入 选 边 集 后 所 
得 到 的 结果 如 图 17-15a 所 示 。 下 一 步 , 具有 顶点 集 
{1,6} 的 树 选择 边 (6,3)， 然 后 剩 下 的 两 棵 树 选 择 边 (2,3)。 
加 入 这 两 条 边 之 后 ， 已 构成 一 棵 生成 树 ， 如 图 17-15b 所 
示 。 把 Sollin 算法 细 化 为 C++ 程序 ， 然 后 证 明 其 正确 性 ， 
这 是 留 给 读者 的 练习 ( 练习 38 )。 

4. 应 该 使 用 哪 一 个 算法 

对 最 小 成 本 生成 树 问题 ,已 经 有 了 三 种 贪 茜 算法 ， 你 应 该 根据 性 能 标准 来 决定 选择 哪 一 
种 。 因 为 三 个 算法 对 空间 的 需求 都 一 样 ， 所 以 这 个 决定 依赖 于 它们 的 时 间 复 杂 性 。Kruskal 算 
法 的 渐 近 时 间 复 杂 性 是 O(n+eloge)，Prim 算法 的 渐 近 时 间 复 杂 性 是 O(02 ( 达到 O(e+nlogn) 也 
是 可 能 的 ， 这 是 练习 37 的 答案 )。Sollin 算法 的 性 能 在 本 章 中 没有 分 析 。 实 验 结果 显示 ，Prim 
算法 一 般 更 快 一 些 。 因 此 ， 应 该 选用 这 个 算法 。 


练习 


8. 扩充 贪 梦 算法 ， 以 解决 两 条 船 的 装载 问题 。 这 样 的 算法 总 能 产生 最 优 解 吗 ? 
9. 已 知 n 个 任务 的 执行 序列 。 假 设 任务 i 需要 ti 个 时 间 单 位 。 如 果 任 务 完成 的 顺序 为 


,n， 则 任务 i 完成 的 时 间 为 6 -> 。 任 务 的 平均 完成 时 间 (average completion time， 
ACT ) 为 Foe 


1 ) 考虑 有 4 个 任务 的 情况 ， 每 个 任务 所 需 时 间 分 别 是 ( 4,2,8,1 )。 若 任务 的 顺序 为 1,2,3,4， 





图 17-15 ”Sollin 算法 的 步骤 


10. 


[2 
Oo 
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则 ACT 是 多 少 ? 

2 ) 车 任务 顺序 为 2,1,4,3， 则 ACT 是 多 少 ? 

3 ) 生成 一 个 任务 序列 ， 使 ACT 最 小 ， 生 成 的 方法 是 : 分 n 步 生成 一 个 任务 序列 ， 每 一 步 
从 剩 下 的 任务 里 选择 时 间 最 少 的 任务 。 例 如 ， 对 1) 应 用 这 种 方法 获得 的 任务 序列 为 
4,2,1,3。 这 种 序列 的 ACT 是 多 少 ? 

4 ) 编写 一 个 C++ 程序 实现 3 ) 的 贪 禁 策 略 ， 程 序 的 复杂 性 应 为 O(nlogn)， 试 证 明之 。 

5 ) 证 明 利用 3 ) 的 贪 禁 算 法 获得 的 任务 顺序 具有 最 小 的 ACT。 

若 有 两 个 工人 执行 练习 9 的 n 个 任务 ， 则 要 为 每 个 人 分 配 任务 和 指定 任务 执行 的 顺序 。 任 

务 完成 时 间 及 ACT 的 定义 与 练习 9 的 相同 。 使 ACT 最 小 的 一 一 种 可 行 的 仿效 算 法 是 ， 两 个 

工人 轮流 选择 任务 ， 每 次 从 剩余 的 任务 中 选择 一 个 时 间 最 小 的 任务 ; 每 人 按照 自己 的 任务 

所 选 得 的 顺序 来 执行 任务 。 以 练习 9 第 1 ) 题 为 例 ， 如 果 第 一 人 首先 选择 任务 4， 则 第 二 

人 选择 任务 2， 然 后 第 一 人 选择 任务 1， 第 二 人 选择 任务 3。 

aati er pl htt 
) 上 述 的 贪 禁 策 略 总 能 获得 最 小 的 ACT 吗 ? 证 明 结 论 。 

i 

1 ) 扩充 练习 10 的 贪 禁 算法 ， 把 两 个 人 改 为 m 个 人 。 

2 ) 算法 能 保证 有 最 优 解 吗 ? 证 明 结论 。 

3 ) 编写 C++ 程序 实现 这 个 算法 。 其 复杂 性 是 多 少 ? 

. 考虑 例 7-5 的 栈 折 码 问题 。 

1 ) 设计 一 个 贪 禁 算法 ， 将 栈 折 县 为 最 小 数目 的 子 栈 ， 使 得 每 个 子 栈 的 高 度 均 不 超过 
height。 

2 ) 算法 能 保证 得 到 数目 最 少 的 子 栈 吗 ” 证 明 结 论 。 

3 ) 编写 C++ 代码 实现 1 ) 的 算法 。 

4) 3 ) 中 代码 的 时 间 复 杂 性 是 多 少 ? 

. 编写 C++ 程序 实现 0/1 背包 问题 ， 使 用 如 下 启发 式 方法 : 按 价值 密度 非 递 减 的 顺序 装 包 。 

.使 用 民 1 的 性 能 受 限 启发 式 方法 ， 编 写 一 个 C++ 程序 来 实现 0/1 背包 问题 。 

.证明 ， 在 使 用 三 1 的 性 能 受 限 启发 式 方法 求解 0/1 背包 问题 时 会 发 生 边 界 错误 。 

.使 用 2 的 性 能 受 限 启发 式 方法 ， 编 写 一 个 C++ 程序 来 实现 0/1 背包 问题 。 

.考虑 0 < x; < 1 而 不 是 x; E {0,1} 的 连续 背包 问题 。 一 种 可 行 的 贪 禁 策略 是 : 从 但 记 大 

非 递减 的 顺序 检查 物品 。 若 剩余 容量 能 容 下 正在 考察 的 物品 ， 将 其 装 入 ; 否则 ， 往 背 包 中 

装 入 此 物品 的 一 部 分 

1 ) 对 于 n=3，w=[100,10,10]，p=[20,15,15] 及 c=105， 使 用 上 述 装 包 方 法 的 结果 是 什么 ? 

2 ) 证 明 这 种 贪 禁 算法 总 能 获得 最 优 解 。 

3 ) 编写 C++ 程序 实现 这 个 算法 。 

. 例 17-1 的 渴 婴 问题 是 练习 17 的 连续 背包 问题 的 一 般 化 。 扩 展 练习 17 的 贪 禁 算法 ， 用 于 

解决 渴 婴 问题 。 算 法 能 保证 得 到 最 优 解 吗 ? 证 明 结 论 。 

. [AOE 网 ] 图 17-4 称 为 顶点 活动 网 ， 因 为 图 的 顶点 表示 活动 或 任务 。 边 活动 网 ( AOE ) 是 

用 图 的 边 表 示 活 动 或 任务 ， 用 顶点 表示 事件 。AOE 网 的 一 个 顶点 表示 开始 事件 s， 另 一 个 

顶点 表示 结束 事件 f。 开 始 事 件 的 入 度 和 结束 事件 的 出 度 都 为 0。 一 个 事件 i， 如 果 不 是 开 

始 事 件 ， 那 么 当 它 发 生 时 ， 所 有 关联 至 顶点 i 的 边 (j,i) 所 表示 的 活动 都 已 经 结束 ， 所 有 
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关联 于 顶点 i 的 边 (i,k) 所 表示 的 活动 都 可 以 开始 。 在 一 个 AOE 网 中 ， 若 干 个 活动 可 以 
同时 进行 。 
图 17-16 是 一 个 具有 8 个 事件 和 12 个 活动 
的 AOE 网 。 边 上 的 数字 是 完成 活动 所 需要 的 
时 间 。 例 如 ,活动 (1,4 ) 需要 5 个 时 间 单 位 完 
成 。 顶 点 1 是 开始 事件 ， 顶 点 8 表示 结束 事件 。 
按照 定义 ， 开 始 事件 发 生 时 间 为 0。 
1 ) 用 一 个 拓扑 序列 列 出 图 17-16 的 所 有 事件 。 








2 ) 令 earliestEventTime(i) 表示 事件 i 的 最 早 发 图 17-16 一 个 AOE 网 
生 时 间 。 证 明 ， 若 事件 i 不 是 开始 事件 ， 则 
earliestEventTime(i)=max(j,i) E Et{earliestEventTime(/)+length(j,)} (17-1) 


其 中 表示 AOE 的 边 集 ，length(ji) 表示 活动 (j,i) 所 需要 的 时 间 。 

3 ) 使 用 公式 (17-1 ) 和 1 ) 的 拓扑 序列 计算 图 17-16 的 所 有 事件 的 最 早 发 生 时 间 。 

4 ) 结束 事件 的 最 早 发 生 时 间 称 为 工程 长 度 (project length )。 计 算 图 17-16 所 表示 的 工程 
长 度 。 

5 ) 令 latestEventTime(i) 表示 事件 i 的 最 迟 发 生 时 间 ， 妈 必须 发 生 的 时 间 。 如 果 事 件 i 直到 
最 迟 时 间 还 没有 发 生 ， 那 么 工程 就 不 能 在 工程 长 度 固定 的 时 间 内 完成 。 显 然 ， 结 束 事 
件 的 最 迟 发 生 时 间 和 最 早 发 生 时 间 相 同 。 假 设 i 不 是 结束 事件 ,证明 : 

latestEventTime(i)=min(iy) E Et{latestEventTime(])-length(i, /)} (17-2) 

6 ) 使 用 公式 ( 17-2 ) 和 1 ) 的 逆向 拓扑 序列 计算 图 17-16 的 所 有 事件 的 最 迟 发 生 时 间 。 

7) 从 AOE 网 的 定义 可 知 ， 一 个 活动 (i,) ) 的 最 早 开始 时 间 earliestActivityTime(i,)) 是 事 
件 的 最 早 发 生 时 间 earliestEventTime(i); 如 果 这 个 活动 开始 的 时 间 晚 于 

latestActivityTime(i, ))=latestEventTime())-length(i, 7) 

那么 工程 就 不 会 在 工程 长 度 时 间 内 完成 。 计 算 图 17-16 的 每 个 活动 的 最 早 开 始 时 间 和 
最 迟 开 始 时 间 。 

8 ) 活动 (i,j) 的 延迟 时 间 (slack,( 刀 ) 是 

latestActivityTime(i,/)—earliestActivityTime(i, )) 

计算 所 有 活动 的 延迟 时 间 。 

9 ) 一 个 活动 ， 若 它 的 延迟 时 间 是 0， 则 称 为 关键 活动 〈critical activity )。 确 定 图 17-16 的 

编写 一 个 程序 ， 输 入 一 个 AOE 网 ( 见 练习 19 )， 然 后 输出 工程 长 度 ， 最 早 和 最 迟 事件 时 

间 和 活动 时 间 ， 延 迟 时 间 和 关键 活动 。 时 间 复 杂 性 应 为 O(n+te)， 其 中 是 事件 数量 ,，e 是 

活动 数量 。 测 试 你 的 程序 。 

如 题 : 

1 ) 证 明 图 17-7 的 算法 找 不 到 覆盖 ， 当 上 且 仅 当 二 分 图 没有 覆盖 。 

2 ) 给 出 一 个 具有 和 覆盖 的 二 分 图 ， 使 得 图 17-7 的 算法 找 不 到 最 小 覆盖 。 

对 图 17-6， 给 出 图 17-8 的 工作 过 程 。 

对 于 二 分 图 覆盖 问题 设计 另外 一 种 贪 禁 启 发 式 方法 。 这 一 次 的 贪 禁 准 则 是 : 若 B 的 一 个 顶 

点 仅 被 4 的 一 个 顶点 覆盖 ， 则 选择 4 的 这 个 顶点 ; 否则 ， 从 4 中 选择 一 个 顶点 ， 它 所 履 

盖 的 未 被 覆盖 的 顶点 数目 最 多 。 
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1 ) 简化 这 种 贪 禁 启发 式 方法 。 

2 ) 编写 一 个 C++ 方法 作为 类 graph 的 成 员 来 实现 上 述 方 法 。 

3 ) 这 个 方法 的 复杂 性 是 多 少 ? 

4 ) 测试 代码 的 正确 性 。 

令 G 为 无 向 图 。G 的 顶点 子 集 8 称 为 完备 子 集 ( cligue )， 当 且 仅 当 $ 的 任意 两 个 顶点 都 

有 一 条 边 相 连 。 完 备 子 图 的 大 小 是 $ 的 顶点 数目 。 最 大 完备 子 图 (maximum clique ) 是 顶 

点 数 最 大 的 完备 子 图 。 寻 找 最 大 完备 子 图 的 问题 ( 即 最 大 完备 子 图 问题 ) 是 一 个 NP- 复杂 

问题 。 

1 ) 简化 最 大 完备 子 图 问题 的 一 种 可 行 的 贪 禁 启 发 式 方法 。 

2 ) 给 出 一 个 能 用 1 ) 的 启发 式 算 法 求解 最 大 完备 子 图 问题 的 图 例 ， 和 一 个 不 能 用 该 算法 

求解 的 图 例 。 

3 ) 将 1) 的 启发 式 算法 细 化 为 一 个 公有 方法 : graph::maxClique(int *cliqueVertices)， 它 的 返 

回 值 是 最 大 完备 子 图 的 大 小 ， 而 且 把 这 个 子 图 的 顶点 存储 在 数组 cliqueVertices 中 返回 。 

4 ) 代码 的 复杂 性 是 多 少 ? 

令 G 为 一 无 向 图 。G 的 顶点 子 集 5 称 为 无 关 集 (independent set )， 当 且 仅 当 8 的 任意 两 个 

顶点 都 无 边 相 连 。 最 大 无 关 集 即 是 顶点 数目 最 多 的 无 关 集 。 在 一 个 图 中 寻找 最 大 无 关 集 是 

一 个 NP- 复杂 问题 。 按 练习 24 的 要 求解 决 最 大 无 关 集 问题 。 

. 对 无 向 图 G 着 色 (coloring ) 方法 是 为 G 的 顶点 编号 {12…} ， 使 得 有 一 条 边 相 连 的 两 个 
顶点 具有 不 同 的 编号 。 所 谓 图 的 着 色 问 题 是 指使 用 最 少 的 颜色 ( 即 编号 ) 给 图 着 色 。 图 的 
着 色 问 题 也 是 一 个 NP- 复杂 问题 。 按 练习 24 的 要 求解 决 图 的 着 色 问 题 。 

.对 图 17-17 的 加 权 有 向 图 ， 列 出 所 有 从 项 点 1 

到 顶点 3 的 简单 路 径 。 每 一 条 路 径 的 长 度 是 多 

少 ? 哪 一 条 是 最 短路 径 ? 

对 图 17-17， 按 长 度 递增 顺序 ， 列 出 从 顶点 1 到 

达 每 一 个 顶点 的 最 短路 径 。 观 察 除 第 一 条 路 径 

之 外 的 每 条 路 径 ， 每 一 条 路 径 都 是 在 前 一 条 路 

径 上 扩充 了 一 条 边 。 图 17-17 一 个 加 权 有 向 图 

. 1) 对 图 17-17， 以 顶点 1 为 源 点 ， 显 示 Dijkstra 方法 (图 17-10 ) 的 初始 时 的 数组 distance- 
FromSource 和 predecessor。 

2 ) 显示 这 两 个 数组 在 步骤 2)、3 ) 和 4 ) 每 一 次 循环 之 后 的 值 。 
3 ) 使 用 最 后 的 数组 predecessor 确定 从 顶点 1 开始 的 最 短路 径 。 

. 以 顶点 5 为 源 点 做 练习 29。 

.证 明 ， 当 按照 长 度 递增 顺序 生成 最 短路 径 时 ， 下 一 条 最 短路 径 总 是 在 上 一 条 最 短路 径 上 扩 
展 一 条 边 得 到 的 。 

.证 明 ， 如 果 一 个 有 向 图 存在 成 本 为 负 的 边 ， 那 么 图 17-10 的 贪 禁 算法 在 计算 最 短路 径 长 度 

时 可 能 不 正确 。 

编写 一 个 函数 path(predecessor sourceVertex, destinationVertex)， 它 利用 方法 shortestPaths 

计算 predecessor 的 值 ， 然 后 输出 从 顶点 sourceVertex 到 顶点 destinationVertex 的 一 条 最 短 

路 径 。 方 法 的 时 间 复 杂 性 是 多 少 ? 

. 把 加 权 有 向 图 作为 linkedWDigraph 类 的 一 个 成 员 ， 重 写 程 序 17-3。 该 程序 应 作为 该 类 的 
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一 个 方法 。 这 个 方法 的 时 间 复 杂 性 是 多 少 ? 

. 把 加 权 有 向 图 作为 linkedWDigraph 类 的 一 个 成 员 而 且 仅 有 O(n) 条 边 ， 重 写 程序 17-3。 把 
newReachableVertices 作为 小 根 堆 。 用 一 个 顶点 的 distanceFromSource 值 作为 优先 级 。 这 
个 方法 的 时 间 复 杂 性 是 多 少 ? 

36. 重 写 程序 17-3， 使 其 适用 于 加 权 无 向 图 和 加 权 有 向 图 ， 而 且 不 依赖 于 图 的 描述 方法 。 这 个 
程序 是 类 graph 的 成 员 函 数 。 

. 1 ) 证 明 Prim 方法 (图 17-13 ) 的 正确 性 。 

2 ) 把 图 17-13 细 化 为 C++ 方法 graph::prim， 复 杂 性 为 O(m*)。( 提示 : 使 用 类 似 程 序 17-3 
求 最 短路 径 的 策略 。) 
3 ) 说 明 方 法 的 时 间 复 杂 性 确实 为 O(n”)。 
.1 ) 证 明 ， 对 每 一 个 联通 无 向 图 ，Solin 算法 都 能 找到 最 小 成 本 生成 树 。 
2 ) Solin 算法 的 步骤 最 多 是 多 少 ? 用 图 的 个 顶点 的 函数 来 表示 这 个 数 。 
3 ) 编写 C++ 方法 graph::sollin， 它 使 用 Sollin 算法 寻找 成 本 最 小 生成 树 。 
4 ) 方法 的 时 间 复 杂 性 是 多 少 ? 
39. 令 了 是 一 棵 树 (不 必 是 二 叉 树 )， 它 的 长 度 与 边 有 关 。 令 $ 是 了 的 顶点 的 子 集 ，77S 表示 从 
T 中 去 除 5 的 顶点 之 后 得 到 的 森林 。 我 们 要 寻找 一 个 最 小 基数 的 子 集 5S， 使 得 7/S 没有 一 
棵 树 具有 从 根 到 叶子 的 路 径 ， 其 长 度 超 过 d。 
1 ) 设计 一 个 贪 焚 算 法 寻找 最 小 基数 $。( 提示 : 从 叶子 开始 移动 到 根 。) 
2 ) 证 明 算 法 的 正确 性 。 
3 ) 算法 的 时 间 复 杂 性 是 多 少 ? 它 应 该 是 项 点 数 的 线性 函数 。 

40. 假设 Ts 表示 这 样 的 森林 ， 它 来 自 5 的 每 一 个 顶点 的 两 份 副本 : 来 自 父 节点 的 指针 指向 一 

个 副本 ， 指 向 孩子 的 指针 来 自 男 一 份 副 本 。 根 据 这 种 假设 完成 练习 39。 

一 个 顶点 数 n>2 的 凸 多 边 形 (6.5.3 节 ) 可 以 三 角形 化 ( 即 划 分 为 或 切割 为 三 角形 ; 三 角 

形 的 每 一 个 角 是 多 边 形 的 一 个 顶点 ) 切割 从 多 边 形 的 一 个 顶点 wx 开始 ， 到 一 个 非 邻 接 的 

顶点 结束 。 切 割 (wv) 的 成 本 记 做 c(wy)。 把 该 多 边 形 三 角形 化 需要 n-2 次 切割 。 

1 ) 设计 一 个 贪 禁 策 略 ， 寻 找 成 本 最 小 的 三 角 切 割 。 

2 ) 你 的 贪 焚 策 略 总 能 找到 成 本 最 小 的 三 角 切 割 吗 ? 证 明 你 的 答案 。 

3 ) 编写 一 个 程序 ， 实 现 你 的 策略 。 测 试 你 的 代码 。 

4 ) 时 间 复 杂 性 是 多 少 ? 


17.4 参考 及 推荐 读物 
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分 而 治之 





概述 


分 而 治之 策略 不 仅 被 君主 和 殖民 者 成 功 地 用 来 统治 殖民 地 ， 也 可 以 用 来 设计 有 效 的 计算 
机 算法 。 本 章 首 先 说 明 如 何 把 这 一 古老 的 分 而 治之 策略 应 用 于 计算 机 算法 设计 。 然 后 利用 这 一 
策略 设计 好 的 分 而 治之 算法 以 解决 如 下 问题 : 最 小 最 大 问题 、 矩 阵 乘法 、 一 个 娱乐 数学 一 一 残 
缺 棋盘 问题 、 排 序 、 选 择 和 一 个 计算 几何 问题 一 一 在 二 维 空间 中 寻找 距离 最 近 的 两 个 点 。 

分 而 治之 算法 把 一 个 问题 实例 分 解 为 若干 个 小 型 而 独立 的 实例 ， 从 而 可 以 在 并 行 计算 机 
上 执行 ; 那些 小 型 而 独立 的 实例 可 以 在 并 行 计算 机 的 不 同 处 理 器 上 完成 。 

本 章 设计 了 一 些 数学 方法 ， 用 来 分 析 常 用 的 分 而 治之 算法 的 复杂 度 ， 并 且 通 过 推导 最 小 
最 大 问题 和 排序 问题 的 复杂 度 下 限 ， 来 证 明 用 分 而 治之 算法 能 够 得 到 这 两 个 问题 的 最 优 解 。 
推导 出 的 下 限 和 分 而 治之 算法 的 复杂 度 是 一 致 的 。 


18.1 算法 思想 


分 而 治之 方法 与 软件 设计 的 模块 化 方法 非常 相似 。 一 个 问题 的 小 实例 可 以 用 直接 方法 求 
解 。 而 要 解决 一 个 问题 的 大 实例 ， 可 以 1 ) 把 它 分 成 两 个 或 多 个 更 小 的 实例 ; 2 ) 分 别 解决 每 
个 小 实例 ; 3 ) 把 这 些小 实例 的 解 组 合成 原始 大 实例 的 解 。 小 实例 通常 是 原 问 题 的 实例 ， 可 以 
使 用 分 而 治之 策略 递归 求解 。 

例 18-1[ 找 出 假币 ] 一 个 袋子 有 16 个 硬币 ， 其 中 可 能 有 一 个 是 假币 ， 并 且 假 币 比 真 币 
要 轻 。 现 在 要 找 出 这 个 假币 ， 而 且 有 一 台 仪 器 可 用 来 比较 两 组 硬币 的 重量 。 

比较 硬币 1 和 硬币 2。 如 果 硬 币 1 比 硬币 2 轻 ， 则 硬币 1 是 假币 。 如 果 硬 币 2 比 硬币 1 
轻 ， 则 硬币 2 是 假币 。 假 如 两 个 硬币 重量 相等 ， 则 比较 硬币 3 和 硬币 4。 同样 ， 如 果 有 一 个 
硬币 轻 一 些 ， 则 寻找 假币 的 任务 完成 。 假 如 两 个 硬币 重量 相等 ， 则 继续 比较 硬币 5 和 硬币 6。 
以 此 方式 ， 最 多 比较 8 次 便 可 以 确定 是 否 存在 假币 ， 而 且 可 以 找到 假币 。 

另 一 种 方法 是 分 而 治之 。 假 设 16 个 硬币 是 一 个 问题 的 大 实例 。 第 一 步 ， 把 这 个 大 实例 
分 成 两 个 或 更 多 的 小 实例 。 把 16 个 硬币 随机 分 成 两 组 4 和 B， 每 组 有 8 个 硬币 。 第 二 步 ， 利 
用 仪器 确定 哪 一 组 有 假币 。 如 果 两 组 重量 相等 ， 则 无 假币 。 如 果 不 等 ， 则 可 以 确定 假币 存在 ， 
并 且 在 较 轻 的 那 一 组 硬币 中 。 最 后 ， 第 三 步 ， 从 第 二 步 的 结果 中 得 到 解 。 在 这 个 算法 中 ,第 
三 步 是 容易 的 。16 枚 硬币 实例 中 只 有 一 个 伪 币 ， 当 且 仅 当 4 或 妃 有 一 个 伪 币 。 因 此 仅仅 通过 
一 次 重量 比较 ， 就 可 以 确定 假币 是 否 存在 。 

现在 假设 要 找 出 假币 。 我 们 把 两 个 或 三 个 硬币 视 为 不 可 再 分 的 小 实例 。 注 意 ， 只 有 一 个 
硬币 ， 不 能 确定 它 是 否 是 假币 。 其 他 实例 都 是 大 实例 。 对 于 一 个 小 实例 ， 用 其 中 的 一 个 硬币 
和 其 他 最 多 两 个 硬币 比较 ， 最 多 比较 两 次 就 可 以 找到 假币 。 

16 个 硬币 是 一 个 大 实例 。 把 它 分 成 两 个 实例 ，4 组 和 B 组 ,每 组 有 8 个 硬币 。 比 较 这 两 
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组 的 重量 ， 可 以 确定 是 否 存在 假币 。 如 果 没 有 假币 ， 则 算法 终止 。 否 则 ， 继 续 划 分 。 假 设 B 
组 较 轻 。 把 8B 组 再 分 成 两 组 ，B1 和 B2， 每 组 有 4 个 硬币 。 如 果 B1 较 轻 ， 则 假币 在 B1 中 。 
再 将 B1 分 成 两 组 ，Bla 和 B1b5， 每 组 有 两 个 硬币 。 继 续 比 较 ， 可 以 得 到 较 轻 的 一 组 。 它 只 有 
两 个 硬币 ， 是 一 个 小 实例 ， 不 需要 再 细 分 。 最 后 一 次 比较 ， 较 轻 者 就 是 假币 。 辐 

例 18-2[ 金 块 问题 ] 一 个 老板 有 一 袋子 金 块 。 每 个 月 有 两 名 雇员 会 因 其 优异 表现 分 别 获 
得 一 个 金 块 的 奖励 。 按 规矩 ， 排 名 第 一 名 的 雇员 得 到 最 重 的 金 块 ， 排 名 第 二 的 雇员 得 到 最 轻 
的 金 块 。 因 为 有 新 的 金 块 定期 加 入 袋 中 ， 所 以 每 个 月 都 必须 找 出 最 轻 和 最 重 的 金 块 。 假 设 有 
一 台 比 较 重 量 的 仪器 ， 我 们 希望 用 最 少 的 比较 次 数 找 出 最 重 和 最 轻 的 金 块 。 

假设 有 ?个 金 块 。 可 以 用 函数 max (程序 1-37 ) 通过 二 1 次 比较 找到 最 重 的 金 块 。 找 到 
最 重 的 金 块 后 ， 可 以 从 余下 的 n-1 个 金 块 中 ， 用 类 似 的 方法 ， 通 过 n-2 次 比较 找 出 最 轻 的 金 
块 。 这 样 ， 总 的 比较 次 数 为 2na-3。 程 序 2-24 和 程序 2-25 是 另外 两 种 方法 ， 前 者 需要 2n-2 次 
比较 ， 后 者 最 多 需要 2n-2 次 比较 。 

下 面 用 分 而 治之 算法 求解 。 当 很 小 时 ， 比 如 说 ,nn < 2, 一 次 比较 就 足够 了 。 当 n 较 大 
时 (n>2 )， 第 一 步 ， 把 一 袋 金 块 平分 成 两 个 小 袋 金 块 4 和 B。 第 二 步 ， 分 别 找 出 在 4 和 8B 中 
最 重 和 最 轻 的 金 块 。 设 4 的 最 重 和 最 轻 的 金 块 分 别 为 Hi 与 L414，B 的 最 重 和 最 轻 的 金 块 分 别 
为 Hs 和 Lg。 第 三 步 ， 比 较 H4 和 Hs, 可 以 找到 所 有 金 块 中 最 重 的 ; 比较 L4 和 Ls， 可 以 找到 
所 有 人 金 块 中 最 轻 的 。 第 二 步 可 以 递归 地 实现 分 而 治之 方法 。 

假设 n=8。 把 大 和 袋子 分 为 两 个 小 袋子 4 和 B， 各 有 4 个 金 块 ( 见 图 18-1a), 为 了 在 4 中 找 
出 最 重 和 最 轻 的 金 块 ， 把 4 的 4 个 金 块 分 成 两 组 41 和 42。 每 组 有 两 个 金 块 。 通 过 一 次 比较 可 
以 在 41 中 找 出 较 重 的 金 块 Hy! 和 较 轻 的 金 块 Ly ( 见 图 18-1b )。 再 通过 一 次 比较 ， 可 以 找 出 
Ha2 和 La2。 现 在 通过 比较 三 1 和 五 2， 能 找 出 已 fi; 通过 Z 和 Lx 的 比较 可 以 找 出 L4。 这 样 ， 
通过 4 次 比较 便 可 以 找到 4 和 LL4。 同 样 ， 再 通过 4 次 比较 可 以 确定 Hs 和 Lg。 现在， 通过 比 
较 H4 和 Ha(L4 和 ZLs) 就 能 找 出 所 有 金 块 中 最 重 (最 轻 ) 的 。 因 此 ， 当 n=8 时 ， 分 而 治之 方法 
需要 10 次 比较 。 而 程序 1-37 需要 13 次 比较 ， 程 序 2-24 和 程序 2-25 最 多 需要 14 次 比较 。 

设 c(n) 为 分 而 治之 方法 所 需要 的 比较 次 数 。 为 了 简便 ,假设 n 是 2 的 军 。 当 n=2 时 ， 
c(n)=1。 对 于 较 大 的 n，c(n)=2c(n/2)+2。 当 nn 是 2 的 窜 时 ,使 用 替代 方法 ( 见 例 2-20 ) 可 知 
c(n)=3n/2-2。 在 本 例 中 ， 使 用 分 而 治之 方法 比 逐 个 比较 的 方法 少 用 了 25% 的 比较 次 数 。 


( ) CH, LY 


(a) (2) a) thirlay (UL) CHE) CH Lay 


a) 分 成 小 袋 b) 找 出 袋子 中 的 重 者 和 轻 者 
图 18-1 在 8 个 金 块 中 找 出 最 重 和 最 轻 的 金 块 国 


例 18-3[ 和 矩阵 乘法 ] 两 个 mxz 阶 矩阵 4 和 中 的 乘积 是 另 一 个 zxz 阶 矩阵 C， 其 中 
C(i,j) 可 表示 为 
CD) = PAG * BK), a (18-1) 
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如 果 使 用 这 个 公式 计算 ,那么 每 一 个 C(i,j) 的 计算 都 需要 n 次 乘法 和 n-1 次 加 法 。 因 此 ， 
整个 C 的 计算 要 mm+n*(n-1)a 次 操作 ， 其 中 m 表示 一 次 乘法 ，a 表示 一 次 加 法 或 减法 。 

为 了 设计 分 而 治之 算法 以 计算 两 个 矩阵 的 乘法 ， 我 们 需要 做 的 是 : 定义 什么 是 一 个 小 实 
例 ; 说 明 小 实例 是 如 何 进行 乘法 运算 ; 确定 把 一 个 大 实例 划分 为 小 实例 的 方法 ; 最 后 描述 如 
何 用 小 实例 的 计算 结果 得 到 大 实例 的 计算 结果 。 为 了 使 讨论 简便 ,假设 n 是 2 的 究 ( 即 n 是 
1,2,4,8,16,.…* )。 

首先 ,假设 n=1 为 小 实例 ，n>1 为 大 实例 。 以 后 如 果 需 要 ， 我 们 将 修改 这 个 假设 。 因 为 小 
实例 就 是 1 x 1 阶 小 矩阵 ， 所 以 把 每 个 矩阵 的 唯一 元 素 直接 相 乘 便 得 到 两 个 矩阵 相 乘 的 结果 。 

考察 一 个 n>1 的 大 实例 。 可 以 将 这 样 的 矩阵 分 成 4 个 W2 xm2 阶 的 矩阵 41、A4;、A4; 和 
44， 如 图 18-2a 所 示 。 当 nn 大 于 1 是 nn 是 2 的 窜 时 ,nn/2 也 是 2 的 震 。 因 此 较 小 矩阵 也 满足 前 
面 对 和 矩阵 大 小 的 假设 。 和 矩阵 B; 和 C 的 定义 与 此 类 似 ，1 < i < 4。 和 矩 阵 乘积 如 图 18-2b 所 示 。 
可 以 利用 公式 ( 18-1 ) 来 证 明 以 下 公式 有 效 : 


C1=4A1B1+4A2B; (18-2 ) 
Cs=A1By+A2B4 (18-3 ) 
C3=A3B1i+A4B; (18-4 ) 
C4=43B2+44B4 (18-5 ) 


根据 上 述 公 式 ， 进 行 n/2 x mW2 阶 和 矩阵 的 8 次 乘法 和 4 次 加 法 ， 就 可 以 计算 出 4 与 B 的 
乘积 。 因 此 ， 利 用 这 些 公 式 可 以 实现 分 而 治之 算法 。 在 算法 的 第 二 步 ， 递 归 地 应 用 分 而 治 
之 算法 ， 计 算 8 个 小 矩阵 的 乘积 。 在 算法 第 三 步 ， 利 用 和 矩阵 相 加 的 算法 (程序 2-21), 将 8 
个 乘积 结果 综合 在 一 起 。 算 法 的 复杂 度 为 8(02)， 与 程序 2-22 的 复杂 度 相同 ， 后 者 直接 使 
用 了 公式 (18-1 )。 实 际 上 ， 和 矩阵 分 制 和 再 组 合 需 要 额外 开销 ， 因 此 分 而 治之 算法 的 运行 速 
度 要 比 程 序 2-22 慢 。 





n/2 n/2 
a) 把 4 分 成 4 个 小 矩阵 b) A*B=C 


图 18-2 ”把 一 个 矩阵 划分 成 几 个 小 矩阵 





为 了 得 到 更 快 的 算法 ,我 们 需要 比 矩 阵 分 割 然后 再 组 合 更 有 效 的 步骤 。 这 便 是 Strassen 
方法 ， 它 用 小 矩阵 的 7 次 乘积 得 到 7 个 矩 阵 D，E,…,，J: 
D=4A1(B,-B') 
E=A4(B3-B') 
F-(43+A4)B! 
G=(A1+43)Ba 
H=(43-41)(B1+B;) 
[=(4,-A4)(B3+B4) 
J=(A1+44)(B1+B) 
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这 7 个 矩阵 D ~ 通过 7 次 矩阵 乘法 ，6 次 矩阵 加 法 ，4 次 矩阵 减法 得 到 。 和 矩阵 4 和 B 相 乘 
的 结果 再 需要 6 次 和 矩阵 加 法 和 两 次 矩阵 减法 得 到 ， 计 算 方法 如 下 : 
CI=E+1+J-G 
Cs=D+G 
C3=E+F 
Cs=D+H+J-F 
把 上 述 方法 应 用 到 n=2 的 和 矩阵 乘法 。 和 矩阵 4 和 B 以 及 相 乘 后 的 结果 和 矩 阵 C 如 下 所 示 : 
1 SI. 6] Ti9 22 
| ls s|=[ss 3 

因为 n>1， 所 以 将 矩阵 4 和 B 分 别 划 分 为 4 个 小 和 矩阵， 如 图 18-2a 所 示 。 每 个 矩阵 为 
1 x 1 阶 ， 仪 包含 一 个 元 素 。1 x 1 阶 和 矩阵 的 乘法 是 矩阵 乘法 的 小 实例 ， 可 以 直接 计算 。 利 用 
D ~ J 的 计算 公式 得 到 : 

D=1(6-8)=-2 
E=4(7-5)=8 
F=(3+4)5=35 
G=(1+2)8=24 
H=(3-1)(5+6)=22 
I=(2-4)(7+8)=-30 
J=(1+4)(5+8)=65 
根据 这 些 值 ， 得 到 矩阵 C 的 4 个 小 矩阵 的 元 素 如 下 : 
Ci=8-30+65-24=19 
C2=-2+24=22 
C3=8+35=43 
C4=-2+22+65-35=50 

对 于 2x2 的 实例 ， 使 用 分 而 治之 算法 需要 7 次 乘法 和 18 次 加 /减法 运算 。 而 直接 使 用 
公式 (18-1 )， 则 需要 8 次 乘法 和 4 次 加 /减法 。 要 使 分 而 治之 算法 更 快 一 些 ， 则 一 次 乘法 所 
花费 的 时 间 必 须 比 14 次 加 /减法 的 时 间 要 长 。 

如 果 对 n 三 8 的 矩阵 乘法 使 用 Strassen 实例 分 割 ， 对 n<8 的 矩阵 乘法 直接 使 用 公 
式 (18-1 )， 则 当 n=8 时 ， 分 而 治之 算法 需要 7 次 4x4 和 挎 阵 乘法 和 18 次 4x4 和 矩阵 加 /减法 。 
每 次 矩阵 乘法 需要 64m+48a 次 操作 ， 每 次 矩阵 加 法 或 减法 需要 16a 次 操作 。 总 操作 次 数 为 
7(64m+48a)+18(16a)=448m+624a。 而 使 用 直接 计算 方法 ， 则 需要 512m+448a 次 操作 。 要 使 
Strassen 方法 比 直接 计算 方法 快 ， 至少 需 要 512-448 次 乘法 比 624-448 次 加 /减法 更 费时 间 ， 
或 者 说 一 次 乘法 比 近似 2.75 次 加 /减法 要 更 费时 。 

如 果 把 n<16 的 矩阵 视 为 “小 ”实例 ， 仅 仅 对 靖 = 16 的 矩阵 乘法 使 用 Strassen 分 解 
方案 ， 对 n<16 的 矩阵 乘法 直接 使 用 公式 (18-1)， 那 么 当 m=16 时 ， 分 而 治之 算法 需要 
7(512m+448a)+18(64a)=3584m+4288a 次 操作 。 而 直接 计算 需要 4096m+3840a 次 操作 。 若 一 次 
乘法 的 用 时 与 一 次 加 /减法 的 用 时 相同 ， 则 Strassen 方法 需要 7872 次 操作 时 间 加 上 实例 分 解 
的 时 间 ， 而 直接 计算 方法 需要 7936 次 操作 时 间 加 上 程序 的 for 循环 以 及 其 他 语句 所 花费 的 时 
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间 。 即 使 直接 计算 方法 所 需要 的 操作 比 Strassen 方法 少 ， 但 前 者 需要 更 多 的 额外 时 间 ， 因 此 
它 也 不 见得 会 比 Strassen 方法 快 。 

就 操作 次 数 而 言 ，n 的 值 越 大 ，Strassen 方法 与 直接 计算 方法 的 差异 就 越 大 。 因 此 对 于 足 
够 大 的 n，Strassen 方法 将 更 快 。 令 t(n) 表示 使 用 Strassen 分 而 治之 方法 所 需要 的 时 间 。 因 为 
大 和 手 阵 将 被 递归 地 分 割 成 小 矩阵 直到 每 个 矩阵 的 大 小 不 大 于 上 (大 至 少 为 8， 也 许 更 大 ， 具 体 
大 小 由 计算 机 的 性 能 决定 )， 所 以 1 的 递归 表达 式 如 下 : 

i 全 | nk 

7t(n/2)+cn’, n>k 

其 中 cz 表示 执行 18 次 n/2 x n/2 阶 矩 阵 加 /减法 以 及 把 大 小 为 于 的 矩阵 分 割 成 小 矩阵 所 需要 

的 时 间 。 用 替代 方法 计算 可 得 t{(n)=B@(n”*2”)。 因 为 log2z7 = 2.81， 所 以 对 符 阵 乘法 的 分 而 治之 

算法 ， 其 渐 近 复杂 度 优 于 程序 2-22。 国 
算法 实现 的 注意 事项 

使 用 分 而 治之 方法 可 以 自然 得 到 递归 算法 。 而 且 在 许多 实例 中 ， 我 们 可 以 用 递归 程序 很 
好 地 实现 递归 算法 。 然 而 实际 上 ， 在 许多 情况 下 ， 我 们 都 在 努力 建立 非 递归 程序 来 实现 递归 
算法 ， 而 且 为 了 这 个 目的 ， 一 般 都 是 用 一 个 栈 来 模拟 递归 栈 。 不 过 在 某 些 实例 中 ， 不 用 栈 也 
可 以 用 非 递 归程 序 实现 分 而 治之 方法 ， 并 且 比 自然 递归 程序 更 快 。 金 块 问题 ( 例 18-2 ) 和 归 
并 排序 (18.2.2 节 ) 的 分 而 治之 方法 的 实现 程序 便 是 这 样 的 程序 。 

例 18-4[ 金 块 问题 ] 用 例 18-2 的 算法 在 8 个 金 块 中 寻找 最 轻 和 最 重 的 金 块 ， 这 个 过 程 
可 以 用 图 18-3 的 二 又 树 来 描述 。 树 的 叶子 分 别 表示 8 个 金 块 (a,b…,h )。 每 一 个 带 阴 影 的 节 
点 表示 一 个 实例 ， 它 所 包含 的 金 块 ， 就 是 以 该 节点 为 根 的 子 树 的 所 有 叶子 。 因 此 ， 根 节点 A 
表示 8 金 块 实例 ， 而 节点 B 表示 4 金 块 (a,， b,c 和 4d ) 的 实例 。 算 法 从 根 节点 开始 。 由 根 节 
点 表示 的 8 金 块 实例 被 划分 成 两 个 4 人 金 块 实例 B 和 C。 由 B 节 点 所 表示 的 4 金 块 实例 被 划分 
成 2 金 块 实例 D 和 BE。 通 过 比较 金 块 a 和 b， 解决 了 DD 表示 的 2 金 块 实例 。 解决 了 D 和 E 的 
金 块 实例 之 后 ， 通 过 比较 D 和 EE 的 结果 ,解决 了 B 表示 的 4 金 块 实例 。 接 着 在 F、G 和 C 上 
重复 这 一 过 程 ， 最 后 解决 了 A 表示 的 8 金 块 实例 。 


(18-6) 










©) 全 
图 18-3 在 8 个 金 块 中 找 出 最 轻 和 最 重 的 金 块 
可 以 将 递归 的 分 而 治之 算法 划分 成 以 下 步骤 ， 
1) 在 图 18-3 的 二 叉 树 中 ， 沿 着 根 至 叶子 的 路 径 ， 把 一 个 大 实例 划分 成 若干 个 大 小 为 1 
或 2 的 小 实例 。 
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2 ) 在 每 个 大 小 为 2 的 实例 中 ， 比 较 确 定 哪 一 个 较 重 和 哪 一 个 较 轻 。 在 节点 D、E、F 和 
G 上 完成 这 种 比较 。 大 小 为 1 的 实例 只 有 一 个 金 块 ， 它 既是 最 轻 的 也 是 最 重 的 。 

3 ) 对 较 轻 的 金 块 进行 比较 以 确定 哪 一 个 最 轻 ， 对 较 重 的 金 块 进行 比较 以 确定 哪 一 个 最 
重 。 对 节点 A、B 和 C 执行 这 种 比较 。 

根据 上 述 划分 ， 得 出 程序 18-1 的 非 递 归 代 码 ， 它 在 表示 重量 的 数组 a[0:n-1] 中 ， 寻 找 最 
小 数 和 最 大 数 ， 且 分 别 用 变量 indexOfMin 和 indexOfMax 返回 它们 的 位 置 。 


程序 18-1 在 af0:n-1] 中 找 出 最 小 值 和 最 大 值 的 非 递归 程序 


template<class T> 
bool minmax(T al[l], int n, int& indexOfMin, intg& indexOfMax) 
{1/ 在 a[0:n-1] 中 确定 最 轻 和 最 重 元 素 的 位 置 如 果 少 于 一 个 元 素 , 范围 false 


if (n < 1) return false; 


if (n == 1) 
{ 
indexOfMin = indexOfMax = 0; 
return true; 
} 
娄 和 L 泊 入 
int si 三 17 // 循环 的 起 点 
和 i 1) //n 为 奇数 
indexOfMin = indexOfMax = 0; 
else 


{1/ 当 是 偶数 时 ， 首 先 比较 的 一 对 元 素 
if tai0] > aa[LL]) 
{indexOfMin = 1l;indexOfMax = 0;} 


else 
{indexOfMin = 0;indexOfMax = 1;} 
S = 2; 
1/ 比较 剩余 元 素 对 
for (int i = ss; i < n; 1 += 2) 


1 
1/ 比 较 a[i] 和 afi + 1]， 然 后 将 较 重 者 和 a[indexOfMax] 比较 , 较 轻 者 和 a[lindexOfMin] 比较 
if (a[i] > a[li + 1]) 
{ 
if (a[li] > a[lindexOfMax]) 
indexOfMax = i; 
if (a[li + 1] < alindexOfMin]) 
indexOfMin = i + 1; 
} 
else 
{ 
if (a[li + 1] > a[lindexOfMax]) 
indexOfMax = i+1; 
if (a[i] < a[lindexOfMin]) 
indexOfMin = 并 
} 
} 
return true? 


} 
en 


452 锚 三 部 分 个 法 询 计 方法 





首先 处 理 的 是 n<l 和 n=1 的 情况 。 如 果 n>1 且 为 奇数 ， 那 么 将 数组 元 素 a[0] 作为 最 小 和 
最 大 元 素 的 候选 者 ， 剩 余 元 素 为 a[1:n-1], 个 数 为 偶数 ， 在 for 循环 中 处 理 。 如 果 n>1 且 为 偶 
数 ， 那 么 头 两 个 权 在 for 循 环 之 外 比较 ， 然 后 用 indexOfMin 和 indexOfMax 分 别 表 示 较 小 者 
和 较 大 者 的 位 置 。 然 后 ， 剩 余 元 素 af[2:n-1]， 个 数 为 偶数 ， 在 for 循环 中 处 理 。 

在 for 循环 中 ， 外 层 让 语句 在 ali] 和 af[i+1] 中 确定 较 轻 者 和 较 重 者 。 这 组 操作 与 上 述 分 
而 治之 算法 的 步骤 2 ) 对 应 。 内 层 让 语句 在 当前 较 轻 者 中 确定 最 轻 者 ， 在 当前 较 重 者 中 确定 
最 重 者 ， 这 组 操作 与 步 又 3 ) 对 应 。 

总 之 ，for 循环 将 每 一 对 (afij，afi+l] ) 的 较 轻 者 与 当前 的 最 轻 者 alindexOfMin] 比较 ， 
较 重 者 与 当前 的 最 重 者 a[indexOfMax] 比较 ， 如 果 必 要 ， 则 修改 indexOfMin 和 indexOfMax 
的 值 。 

下 面 分 析 算 法 的 复杂 度 。 当 na 为 偶数 时 ， 在 for 循环 外 部 有 一 次 比较 ， 内 部 有 3(n/2-1) 
次 比较 。 总 的 比较 次 数 为 3n/2-2。 当 n 为 奇数 时 ， 在 for 循环 外 部 没有 比较 ， 内 部 有 3(n-1)/2 
次 比较 。 因 此 ,无论 n 为 奇数 或 偶数 ， 当 n>0 时 ， 总 的 比较 次 数 为 [3n/21-2 。 我 们 在 18.4.1 
节 将 证 明 ， 这 是 在 寻找 最 大 最 小 值 的 算法 中 ， 比 较 次 数 最 少 的 算法 。 


练习 


1. 将 例 18-1 的 分 而 治之 算法 扩充 到 n>1 个 硬币 。 需 要 进行 多 少 次 重量 的 比较 ? 
2. 考虑 例 18-1 的 假币 问题 。 假 设 硬币 还 是 nn 个， 但 是 条 件 “ 假 币 的 重量 比 真 币 的 轻 ” 变 为 
“假币 与 真 币 的 重量 不 同 ”。 
1 ) 设计 相应 的 分 而 治之 算法 。 如 果 不 存在 假币 ， 则 输出 信息 “不 存在 假币 ”， 否 则 ， 找 出 
假币 。 用 递归 方法 将 大 的 问题 实例 划分 成 两 个 较 小 的 问题 实例 。 如 果 假 币 存 在 ， 那 么 找 
出 假币 需要 多 少 次 比较 ? 
2 ) 重 做 1 )， 但 是 把 大 的 问题 实例 划分 为 三 个 较 小 的 问题 实例 。 
3. 1 ) 编写 C++ 程序 ， 实 现 例 18-2 中 寻找 n 个 元 素 的 最 大 值 和 最 小 值 的 两 种 方案 。 使 用 递归 
来 实现 分 而 治之 方案 。 
2 ) 程序 2-24 和 程序 2-25 是 寻找 n 个 元 素 的 最 大 值 和 最 小 值 的 男 外 两 个 代码 。 计 算 每 一 个 
代码 所 需要 的 最 少 和 最 多 的 比较 次 数 。 
3 ) 假设 nn 分别 等 于 100、1000 或 10000， 比 较 代码 1) 和 2) 以 及 程序 18-1 的 运行 时 间 。 
对 于 程序 2-25， 使 用 平均 时 间 和 最 坏 情况 下 的 时 间 。 代 码 1 ) 和 程序 2-24 应 具有 相同 
的 平均 时 间 和 最 坏 情 况 下 的 时 间 。 
4 ) 注意 ， 除 非 比较 操作 的 用 时 很 多 ， 分 而 治之 算法 在 最 坏 情况 下 不 会 优 于 其 他 算法 。 为 什 
么 ? 它 的 平均 时 间 优 于 程序 2-25 吗 ? 为 什么 ? 
4. 证 明 ， 直 接应 用 公式 (18-2) ~ 公式 (18-5) 设计 的 和 抢 阵 乘法 的 分 而 治之 算法 ， 其 复杂 度 为 
9(2)。 因 此 相应 的 程序 比 程序 2-22 要 慢 。 
5. 用 蔡 代 法 来 证 明 公式 (18-6) 的 递归 解 为 6(n"*2")。 
6. 编写 程序 ， 实 现 Strassen 矩阵 乘法 的 算法 。 利 用 不 同 的 大 值 ( 见 公式 (18-6 ) ) 进行 实验 ， 以 
确定 大 为 何 值 时 程序 性 能 最 佳 。 和 程序 2-22 比较 运行 时 间 。 可 取 为 2 的 寡 。 
7. 当 n 不 是 2 的 究 时 ， 可 以 在 矩阵 中 增加 最 少 的 行 数 和 列 数 ， 使 矩阵 的 阶 数 m 为 2 的 宕 。 
1 ) 求 比率 m/n。 
2 ) 用 哪些 矩阵 项 组 成 新 的 行 和 列 ， 使 得 在 新 矩阵 4' 和 B 的 乘积 矩阵 C' 中 ， 原 矩阵 4 


和 B 的 乘积 位 于 左上 角 ? 
3 ) 使 用 Strassen 方法 计算 4'x B′ 所 需要 的 时 间 为 9(m”™)。 给 出 以 为 变量 的 运行 时 间 


18.2 应 用 


18.2.1 残缺 棋盘 


1. 问题 描述 

残缺 棋盘 (defective chessboard) 是 一 个 有 2 x 2* 个 方 格 的 棋盘 ， 其 中 惟有 一 个 方 格 残 缺 。 
图 18-4 给 出 上 大 2 时 的 一 部 分 可 能 的 残缺 棋盘 ， 其 中 残缺 的 方 格 用 阴影 表示 。 注 意 ， 当 k=0 
时 ， 仅 存在 一 种 可 能 的 残缺 棋盘 ( 如 图 18-4a 所 示 )。 事实 上 ， 对 于 任意 k， 恰 有 2* 种 不 同 的 


残缺 棋盘 。 
a) k=0 b) k=1 c) kl d) 有 1 
e) k=2 f) k=2 g) 2 


图 18-4 ”残缺 棋盘 
在 残缺 棋盘 问题 中 ， 要 求 用 三 格 板 覆 盖 残 缺 棋盘 ( 如 图 18-5 所 示 )。 在 覆盖 中 ， 任 意 两 
个 三 格 板 不 能 重 肆 ,任意 一 个 三 格 板 不 能 覆盖 残缺 方 格 ， 但 三 格 板 必须 覆盖 其 他 所 有 方 格 。 
在 这 种 限制 条 件 下 ， 所 需 的 三 格 板 总 数 为 (2*-1)/3。 可 以 证 明 (2*-1)/3 是 一 个 整数 。 大 为 0 的 
残缺 棋盘 很 容易 被 覆盖 ， 因 为 它 没有 非 残 缺 的 方 格 ， 用 于 覆盖 的 三 格 板 的 数目 为 0。 当 丘 1 
时 ， 每 个 残缺 棋盘 正好 有 3 个 非 残缺 的 方 格 ， 可 用 图 18-5 中 某 一 方向 的 三 格 板 来 覆盖 。 


b) c) d) 


图 18-5 不 同方 向 的 三 格 板 





2. 求解 策略 
使 用 分 而 治之 法 ， 可 以 很 好 地 解决 残缺 棋盘 问题 。 把 2: x 2* 的 残缺 棋盘 实例 划分 为 较 小 
的 残缺 棋盘 实例 。 一 个 自然 的 划分 结果 是 4 个 2 x 2 棋盘， 如 图 18-6a 所 示 。 注 意 ， 原 来 
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的 2x2 闪 棋盘 仅仅 有 一 个 残缺 方 格 ， 因 此 划分 之 后 ， 在 4 个 小 棋盘 中 仅仅 有 一 个 棋盘 存在 残 
缺 方 格 。 首 先 履 盖 残 缺 方 格 的 小 棋盘 。 然 后 把 
剩 下 的 3 个 小 棋盘 转变 为 残缺 棋盘 ， 为 此 ,将 
一 个 三 格 板 放置 由 这 3 个 小 棋盘 形成 的 角 上 ， 
如 图 18-6b 所 示 ， 其 中 ， 原 2x2 棋 盘 的 残缺 ”一 一 一 二 一 一 一 
方 格 位 于 左上 角 的 251x 2 棋盘 。 递 归 地 使 用 | ye | yw 
这 种 分 割 技术 。 当 棋盘 的 大 小 减 为 1x1 时 ， 
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递归 过 程 终 止 。 此 时 的 1 x 1 棋盘 仅仅 包含 一 ns i 
个 方 格 且 为 残缺 方 格 ， 无 需 覆 盖 三 格 板 。 ma 


我 们 可 以 一 一 个 递归 的 C++ 函数 tleBoard ( 见 程序 18-2 ) 来 实现 上 述 的 分 而 治之 算法 。 该 
函数 利用 了 两 个 全 局 整数 变量 board 和 tile。 board 是 一 个 二 维 整 型 数组 ， 表 示 棋 盘 ,board[0][0] 
表示 棋盘 的 左上 角 的 格子 ; tile 是 一 个 整 型 变量 ， 初 始 值 为 1， 它 给 出 下 一 个 覆盖 的 索引 。 


程序 18-2 ”覆盖 残缺 棋盘 


1/ 全 局 变量 
int **board; // 棋盘 
int tiles 1/ 当前 使 用 的 三 格 板 


void tileBoard(int topRow, int topColumn, 
int defectRow, int defectColumn, int size) 
{//topRow 表示 棋盘 左上 角 方 格 的 行 号 
/topcolumn 表示 棋盘 左上 角 方 格 的 列 号 
/1 defectRow 表示 残缺 方法 的 行 号 
// defectCcolumn 表示 残缺 方法 的 列 号 
// size 表示 棋 盘 一 个 边 的 长 度 
if (size == 1) return; 
int tileToUse = tilet++; 
quadrantSize = size / 2; 


1/ 履 盖 左上 角 和 象限 
if (defectRow < topRow + quadrantSize && 
defectColumn < topColumn + quadrantsize) 
// 残缺 方 阁 属于 这 个 象限 
tileBoard(topRow, topColumn, defectRow, defectColumn, quadrantsize),; 
else 
TO 
/在 右 下 角 放 置 一 个 三 格 板 
board[itopRow + quadrantSize - 1] [topCcolumn + quadtrantSize - 1] 
= tileToUse; 
/覆盖 其 余 的 方 格 
上 tileBoara (上 opPRow， topColumn, topRow + quadrantSize - 1, 
topColumn + GuaarantSize - 1, quadrantSize); 
} 


1/ 剩余 三 个 象限 的 覆盖 代码 类 似 
} 





初始 函数 调用 为 tileBoard(0,0,dRow,dCol,size)， 其 中 size=2*，dRow 和 和 dCol 是 残缺 方 
格 的 行列 索引 。 有 覆盖 残 缺 棋盘 所 需要 的 三 格 板 数目 为 (size*-1)/3。 函 数 tileBoard 用 整数 1 到 


(size”-1)/3 来 表示 这 些 三 格 板 ， 并 用 三 格 板 的 标号 来 标记 被 该 三 格 板 覆 盖 的 非 残缺 方 格 。 

4. 时 间 复 杂 度 分 析 

令 1( 忆 为 函数 tleBoard 覆盖 一 个 2 x 2 残缺 棋盘 所 需要 的 时 间 。 当 本 0 时 ，size=1， 所 
需 时 间 为 一 个 常数 4。 当 fz0 时 ,需要 4 次 递归 函数 调用 ， 所 需 时 间 为 44(k-1)。 除 去 这 些 时 
间 以 外 ,让 条 件 测试 和 3 个 非 残缺 方 格 的 覆盖 也 需要 时 间 。 令 常数 c 表示 这 些 额 外 时 间 。 可 
以 得 到 Kb) 的 递归 表达 式 如 下 : 

k=0 
-oora 人。 人 

用 替代 方法 ( 见 例 2-20 ) 来 计算 这 个 表达 式 ， 可 得 { 昌 =@(49=@B( 所 需 三 格 板 的 数目 )。 
因为 放置 每 一 块 三 格 板 至 少 用 时 @()， 所 以 不 可 能 有 一 个 比分 而 治之 算法 的 渐 近 性 能 更 好 的 
算法 。 
18.2.2 ”归并 排序 


1. 排序 方法 

可 以 应 用 分 而 治之 法 来 设计 排序 算法 ， 把 n 个 元 素 按 非 递 减 顺 序 排列 。 这 种 排序 算法 常 
用 的 结构 是 : 奎 n 为 1， 则 算法 终止 ; 否则 ， 将 序列 划分 为 上 个 子 序列 (下 是 不 小 于 2 的 整数 )。 
先 对 每 一 个 子 序列 排序 ， 然 后 将 有 序 子 序列 归并 为 一 个 序列 。 

假设 将 n 个 元 素 的 序列 仅仅 划分 为 两 个 子 序列 ， 称 之 为 二 路 划分 。 一 种 二 路 划分 是 把 前 
面 n-1 个 元 素 放 到 第 一 个 子 序列 中 ( 称 为 4 )， 最 后 一 个 元 素 放 到 第 二 个 子 序列 中 ( 称 为 B )。 
按照 这 种 划分 方式 对 4 递归 地 进行 排序 。 由 于 8 仅 含 一 个 元 素 ， 所 以 它 已 经 有 序 。 在 4 排序 
后 ， 使 用 程序 2-10 的 insert 函数 将 4 和 B 归 并。 把 这 种 排序 与 插入 排序 insertionSort ( 见 程 
序 2-15 ) 比较 ， 可 以 发 现 它 实际 上 是 插入 排序 的 递归 形式 。 该 算法 的 复杂 度 为 O(n7)。 

另 一 种 二 路 划分 是 将 关键 字 最 大 的 元 素 放 人 有 8， 剩 余 元 素 放 入 4。 然 后 对 4 递归 排序 。 
为 了 将 排序 后 的 4 和 如 归并 ， 这 时 只 需要 将 好 附加 到 4 的 尾部 。 如 果 使 用 程序 1-37 的 函数 
Max 来 寻找 关键 字 最 大 的 元 素 ， 那 么 这 种 排序 算法 实际 上 就 是 选择 排序 selectionSort ( 见 程 
序 2-7 ) 的 递归 形式 。 如 果 使 用 程序 2-8 的 冒 泡 函 数 来 寻找 关键 字 最 大 的 元 素 并 把 它 移 到 最 右 
边 的 位 置 ， 那 么 这 种 排序 算法 就 是 冒 泡 排 序 bubbleSort ( 见 程 序 2-9 ) 的 递归 形式 。 这 两 种 排 
序 算法 的 复杂 度 均 为 90。 如果 4 一 旦 有 序 ， 就 终止 对 4 的 递归 划分 ， 则 算法 的 复杂 度 为 
O0D ( 见 例 2-16 和 例 2-17 )。 

上 述 划 分 方案 将 n 个 元 素 序列 划分 为 两 个 极 不 平衡 的 子 序列 4 和 B。4 有 n-l 个 元 素 ， 
而 妃 仅 有 一 个 元 素 。 如 果 划 分 得 平衡 一 点 ， 情 况 会 怎样 呢 ? 假设 4 包含 nk 个 元 素 ,，B 包含 
其 余 的 元 素 。 递 归 地 应 用 分 而 治 法 对 4 和 B 进行 排序 ， 然 后 采用 一 个 被 称 之 为 归并 的 过 程 ， 
将 有 序 子 序列 4 和 8B 归并 成 一 个 序列 。 

例 18-5 假设 有 8 个 元 素 ， 关 键 字 分 别 为 [10,4,6,3,8,2,5,7]。 如 果 选 定 k=2， 则 子 序列 
[10,4,6,3] 和 [8,2,5,7] 需要 分 别 独立 排序 ， 结 果 得 到 两 个 有 序 子 序列 [3,4,6,10] 和 [2,5,7,8]。 现 
在 从 头 元 素 开 始 ， 将 这 两 个 有 序 子 序列 归并 到 一 个 子 序列 。 元 素 2 与 3 比较 ，2 被 移 到 归并 
序列 ; 3 与 5 比较 ，3 被 移 到 归并 序列 ; 4 与 5 比较 ，4 被 移 到 归并 序列 ; 5 和 6 比较， 以 此 
类 推 。 

如 果 选 定 k=4， 则 子 序列 [10,4] 和 [6,3,8,2,5,7] 需要 分 别 独立 排序 。 结 果 得 到 两 个 有 序 子 
序列 [4,10] 和 [2,3,5,6,7,8]。 将 它们 归并 后 便 是 所 求 的 有 序 序 列 。 国 
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图 18-7 是 对 该 分 而 治之 排序 算法 的 简单 描述 。 当 生成 的 较 小 的 实例 个 数 为 2， 且 4 划分 
后 的 子 序列 具有 n/k 元 素 时 ,算法 便 可 以 得 到 最 后 结果 。 


void Sort (E,n) 
{1/ 对 EE 中 的 nn 个 元 素 排 序 ，k 是 全 局 变量 
if (n>=k) 
{ 
i=n/k; 


j=n-i; 
令 A 由 互 的 前 主 个 元 素 组 成 
令 B 由 孔 剩 余 的 j 个 元 素 组 成 


sort (A,i); 

SoOrt(B, j] }2 

merge (A,B,E,i,j); // 把 A 和 B 合并 到 玉 
} 
else 


对 巨 插 入 排序 





图 18-7 分 而 治之 排序 算法 的 伪 码 


从 归并 过 程 的 简明 描述 中 可 以 明显 地 看 出 ， 归 并 个 元 素 所 需要 的 时 间 为 O(n)。 设 Km) 
为 分 而 治之 排序 算法 ( 如 图 18-7 所 示 ) 在 最 坏 情 况 下 的 用 时 。 我 们 有 i(n) 的 递 推 公式 如 下 : 
‘(n) ee I C68) 
其 中 c 和 4 为 常数 。 从 公式 (18-8 ) 可 知 ， 当 x(n/)+tn-n/f) 最 小 时 ，i(n) 最 小 。 
定理 18-1 令 f(x) 满足 
f(y+qd)-f(y) f(z+d)-f(z), yz,d>0 (18-9) 
对 每 一 个 实数 w， 当 好 2 时 ，f(w/ 有 +f(w-w/h) 是 最 小 的 。 
证 明 将 z=y-4 带 入 公式 (18-9)， 得 到 
fy+d)-f(y) = f(y) f(y-d) 
或 者 
2/(y) < f(y+d)+f(y-d) (18-10) 
当 K 三 2 时 ,将 4=w/2-w/k 和 y=w/2 带 入 公式 (18-9)， 当 k<2 时， 将 d=w/k-w/2 和 y=w/2 带 
入 公式 (18-9 )， 都 可 以 得 到 
21(w/2) < 1 有 + 有 
证 毕 。 站 
每 一 个 排序 算法 都 具有 时 间 复 杂 度 Q(nlogn) ( 见 18.4.2 节 )。 因 此 ， 当 2 时 ， 即 两 个 较 
小 的 实例 大 小 接近 相等 时 ，f(n)=t(n) 满足 公式 ( 18-9 )， 且 图 18-7 算法 的 时 间 复 杂 度 最 小 。 实 
际 上 ， 复 杂 度 Q(n) 足以 满足 公式 (18-9 )。 当 两 个 较 小 的 实例 所 包含 的 元 素 个 数 近 似 相 等 时 ， 
分 而 治之 算法 通常 具有 最 佳 性 能 。 
在 t(n) 的 递 推 公式 中 ， 取 三 2， 可 得 到 如 下 递 推 公式 : 
d, nl 
‘(nm) a n>1 
因为 上 面 的 递 推 公式 包含 上 下 取 整 操作 符 ， 所 以 计算 比较 困难 。 如 果 仅 假设 为 2 的 震 ， 








那么 递 推 公式 具有 如 下 简单 形式 : 
ad, nl 
tm)= Ce n>1 
可 以 用 替代 法 来 计算 这 一 递 推 方 式 ， 结 果 为 1(n)=B(nlogn)。 这 个 结果 虽然 是 在 nn 为 2 的 
短 时 得 到 的 ,但 对 于 所 有 的 n 也 是 有 效 的 ， 因 为 in) 是 的 非 递 减 函数 。 因 为 {(n)=B(nlogn)， 
所 以 (nlogn) 是 归并 排序 的 最 好 和 最 坏 情况 下 的 复杂 度 。 因 为 最 好 和 最 坏 情况 下 的 复杂 度 一 
样 ， 所 以 归并 排序 的 平均 复杂 度 也 是 (nlogn)。 
2. C++ 实现 
图 18-7 在 和 2 时 的 排序 算法 称 为 归并 排序 (merge sort )， 更 准确 地 说 ， 是 二 路 归并 排序 
(two-way merge sort )。 下面 将 图 18-7 在 好 2 时 的 归并 排序 细 化 为 对 个 元 素 排序 的 C++ 函 
数 。 一 种 最 简单 的 方法 是 用 链表 存储 元 素 ( 见 6.1 节 )。 将 链表 在 第 (1/2 ) 个 节点 处 断 开 ， 分 
为 两 个 大 致 相等 的 子 链表 。 归 并 过 程 将 两 个 排序 后 的 子 链表 归并 在 一 起 。 但 是 我 们 不 使 用 链 
表 ， 因 为 我 们 要 与 堆 排 序 和 插入 排序 做 性 能 比较 ， 而 后 两 种 排序 方法 都 不 使 用 链表 。 
归并 排序 函数 用 一 个 数组 a 来 存储 元 素 序 列 E， 并 用 a 返回 排序 后 的 序列 。 当 序列 EE 
被 划分 为 两 个 子 序列 时 ， 不 必 把 它们 分 别 复 制 到 A 和 B 中 ， 只 需 简单 地 记录 它们 在 序列 忆 
中 的 左右 边界 。 然 后 将 排序 后 的 子 序列 归并 到 一 个 新 数组 b 中 ， 最 后 再 将 它们 复制 回 a 中 。 
图 18-8 是 图 18-7 的 细 化 版 。 









void mergeSort (T *a,int left,int right) 
{ // 对 数组 元 素 a[left:right] 排序 
if (left<right) 
{ // 至少 有 两 个 元 素 
int middle= (left+right)/2; 
mergeSort (a, left,diddle); 
mergeSort (a,middle+l,right); 
merge (a,b,left,middle, right); /从 aa 到 Pb 归并 
copy (baleft, right): // 将 排序 结果 复制 到 a 
















} 






图 18-8 分 而 治之 排序 算法 的 改进 


可 以 从 很 多 方面 改进 图 18-8 的 性 能 。 例 如 ， 消 除 递 归 。 如 果 仔 细 考 察 这 个 程序 ， ER 
现 ， 递 归 只 是 简单 地 对 序列 反复 划分 ， 直 到 序列 的 长 度 变 为 1， 这 时 再 进行 归并 。 这 个 过 程 
用 为 2 的 窜 来 描述 会 更 好 。 长 度 为 1 的 子 序 列 被 归并 为 长 度 为 2 的 有 序 子 序列 ; A 2 
的 子 序列 被 归并 为 长 度 为 4 的 有 序 子 序列 ; 这 个 过 程 不 断 地 重复 直到 归并 为 一 个 长 度 为 n 的 
序列 。 图 18-9 是 n=8 时 的 归并 ( 和 复制 ) 过 程 ， 方 括号 表示 一 个 有 序 序列 左右 边界 。 


初始 段 [8] [4] [5] [6] [2] [1] [7] [3] 
归并 到 4 3] [5 €] [11 2 [3 
复制 到 a 4 8 [5 6 [1 2 [3 7 
归并 到 b [4 5 6 8] [1 2 3 7 
复制 到 a 了 过 首 如 位 虽 针 局 
归并 到 b 有 2 
复制 到 a 陡 深 5 和 
图 18-9 ”归并 排序 的 例子 
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二 路 归并 排序 的 一 种 迭代 算法 是 这 样 的 : 首先 将 每 两 个 相 邻 的 大 小 为 1 的 子 序列 归并 ， 
然后 将 每 两 个 相 邻 的 大 小 为 2 的 子 序列 归并 ， 如 此 反复 ， 直 到 只 剩 下 一 个 有 序 序列 。 轮 流 
地 将 元 素 从 a 归并 到 b， 从 b 归并 到 a， 实际 上 消除 了 从 b 到 a 的 复制 过 程 。 这 个 算法 见 程 
序 18-3。 


程序 18-3 ”用 归并 排序 法 对 数组 元 素 a[0:n-1] 排序 


template <class T> 

void mergeSort (T al[l], int n) 

{1// 使 用 归并 排序 方法 对 a[0 : n - 1] 排序 
T *b = new T [n]; 
int SegmentSize = 1; 
while (segmentSize < n) 


{ 


mergePass(la, b, n, segmentSize); 1// 从 a 到 bb 的 归并 
segmentSize += segmentSize; 
mergePass(b, a, n, segmentsize); /从 b 到 a 的 归并 


segmentSize += segmentSize; 
} 
delete[] b; 
} 


为 了 完成 排序 代码 ， 需 要 函数 mergePass ( 见 程 序 18-4 )。 不 过 这 个 函数 仅 用 来 确定 需要 
归并 的 子 序列 的 左右 边界 。 实 际 的 归并 是 由 函数 merge ( 见 程序 18-5 ) 完成 的 。 


程序 18-4 ”把 相 邻 的 两 个 数据 段 从 x 到 y 归并 


template <class T> 
void mergePass(T x[], T yl[], int n, int segmentSize) 
{1/ 从 x 到 yy 归并 相 邻 的 数据 段 
jt 二 刘 /下 一 个 数据 段 的 起 点 
while (i <=n- 2 * segmentSize) 
{1/ 从 x 到 y 归 并 相 邻 的 数据 段 
merge (X,yY，i，1 + SegmentSize - 1, i + 2 * SegmentSize - 1) 
i=i+2* segmentsize; 


} 


/ 少 于 两 个 满 数据 段 
if (i + segmentSize < n) 

/ 剩 有 两 个 数据 段 

merge (x,y, i, i + SegmentSize - 1, n - 1)， 
else 

1/ 只 剩 一 个 数据 自 ， 复制 到 y 

for (nt 二 Ly < A ++) 

y[j] = x[j]; 


程序 18-5 ”把 相 邻 的 数据 段 从 c 到 d 归并 


template <class T> 
void mergel(T c[], T d[], int startOfFirst, int endOfFirst, 
int endOfSecond) 
{1/ 把 两 个 相 令 数据 段 从 c 归并 到 
int first = startOfFirst, // 第 一 个 数据 段 的 索引 
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second = endOofFirst + 1, 1// 第 二 个 数据 段 的 索引 
result = startOfFirst; / 归并 数据 段 的 索引 


1/ 直到 有 一 个 数据 段 归 并 到 归并 段 d 
while ((first <= endOfFirst) && (second <= endOfSecond)) 
if (cl[first] <= cl[lsecond]) 


d[lresult++] = clfirst++]; 
else 
d[result++] = c[second++]; 
// 归并 剩余 元 素 


iF (fi4StE, > SnaDFFiSSt) 
for (int gq = second; q <= endOfSecond; q++) 


d[result++] = clqg]; 
else 
for (int q = first; q <= endOfFirst; q++) 
dlresult++] = cl[lq]; 


} 


3. 自然 归并 排序 

程序 18-3 归并 排序 函数 也 称 直接 归并 排序 ( straight merge sort )。 在 自然 归并 排序 中 ， 首 
先 认定 在 输入 序列 中 已 经 存在 的 有 序 段 。 例 如 ， 在 输入 数列 [4,8,3,7,1,5,6,2] 中 可 以 认定 4 个 有 
序 段 : [4,8]，[3,7]，[1,5,6] 和 [2]。 认 定 的 方法 是 ， 从 左 至 右 扫 描 序 列 元 素 ， 若 位 置 i 的 元 素 比 
位 置 it1 的 元 素 大 ， 则 位 置 i 便 是 一 个 分 割 点 。 然 后 归并 这 些 有 序 段 ， 直 到 剩 下 一 个 有 序 段 。 

归并 有 序 段 1 和 2 可 得 有 序 段 [3,4,7,8]， 归 并 有 序 段 3 和 4 可 得 有 序 段 [1,2,5,6]， 最 后 ， 
归并 这 两 个 有 序 段 得 到 [1,2,3,4,5,6,7,8]。 这 样 ， 只 需要 两 次 归并 。 程 序 18-3 的 初始 归并 段 长 
度 为 1， 经 过 3 次 归并 完成 排序 。 

自然 归并 排序 的 最 好 情况 是 ， 输 入 序列 已 经 有 序 。 自 然 归并 排序 只 认定 了 一 个 有 序 
段 ， 不 需要 归并 ， 但 程序 18-3 仍 要 进行 |logzn| 趟 归并。 因此 自然 归并 排序 需 用 时 8@(n)。 
而 程序 18-3 需 用 时 @(nlogn)。 

自然 归并 排序 的 最 坏 情 况 是 输入 序列 按 递减 顺序 排列 。 最 初 认定 的 有 序 段 有 个 。 这 时 
的 归并 排序 和 自然 归并 排序 需要 相同 的 归并 次 数 ,但 自然 归并 排序 为 记录 有 序 段 的 边界 需要 
更 多 的 时 间 。 因 此 ， 在 最 坏 情 况 下 的 性 能 ， 自 然 归并 排序 不 如 直接 归并 排序 。 

在 一 般 情况 下 ，n 个 元 素 序列 有 mw2 个 有 序 段 ， 因 为 第 i 个 元 素 关键 字 大 于 第 i+1 个 元 素 
关键 字 的 概率 是 0.5。 如 果 开 始 的 有 序 段 仅 有 n/2 个 ， 那 么 自然 归并 排序 所 需 的 归并 比 直接 归 
并 排序 的 要 少 。 但 是 自然 归并 排序 在 认定 初始 有 序 段 和 记录 有 序 段 的 边界 时 需要 额外 时 间 。 
因此 ， 只 有 输入 序列 确实 有 很 少 的 有 序 段 时 ， 才 建议 使 用 自然 归并 排序 。 


18.2.3 ”快速 排序 


1. 排序 方法 

用 分 而 治之 法 可 以 实现 男 一 种 完全 不 同 的 排序 一 一 快速 排序 ( quick sort )。 把 n 个 元 素 
划分 为 三 段 : 左 段 left、 中 间 段 middle 和 右 段 right。 中 段 仅 有 一 个 元 素 。 左 段 的 元 素 都 不 
大 于 中 间 段 的 元 素 ， 右 段 的 元 素 都 不 小 于 中 间 段 的 元 素 。 因 此 可 以 对 left 和 right 独立 排序 ， 
并 且 排 序 后 不 用 归并 。middle 的 元 素 称 为 支点 ( pivot ) 或 分 割 元 素 ( partitioning element )。 
图 18-10 描述 了 快速 排序 。 
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// 对 a[0:n-1] 快速 排序 
从 a[0:n-1] 中 选择 一 个 元 素 作为 支点 ， 组 成 中 间 段 。 
把 剩余 元 素 分 为 左 段 left 和 右 段 right。 使 左 段 的 元 素 关 键 字 都 不 大 于 支点 关键 字 ， 右 段 的 元 素 关 键 字 都 


不 小 于 支点 的 关键 字 
对 左 段 递归 快速 排序 
对 右 段 递归 快速 排序 
最 终结 果 按 左 段 、 中 间 段 和 右 段 排列 





图 18-10 快速 排序 的 简单 描述 


考察 元 素 序 列 [4,8,3,7,1,5,6,2]。 假 设 选择 元 素 6 作为 支点 。 因 此 6 属于 middle ; 4,3,1,5,2 
属于 left ; 8 和 7 属于 right。left 排序 结果 为 1,2,3,4,5 ; right 排序 结果 为 7.8。 把 右 段 right 的 
元 素 放 在 支点 之 后 ， 左 段 left 的 元 素 放 在 支点 之 前 ， 即 可 得 到 有 序 序列 [1,2,3,4,5,6,7,8]。 在 
对 数据 段 [4,3,1,5,2] 递归 快速 排序 时 ， 如 果 选 择 3 为 支点 ， 则 左 段 包含 1 和 2， 右 段 包 含 4 和 
5。 左 段 和 右 段 分 别 排序 后 ， 和 支点 组 成 有 序 段 [1,2,3,4,5]。 

2. C++ 实现 

程序 18-6 的 快速 排序 函数 quickSort 把 数组 a 的 最 大 元 素 移 动 数组 的 最 右 端 ， 然 后 调用 
程序 18-7 的 递归 函数 quickSort 执行 排序 。 程 序 18-7 要 求 每 一 个 数据 段 ， 或 者 其 最 大 元 素 位 
于 右 端 ， 或 者 其 后 继 元 素 大 于 数据 段 的 所 有 元 素 ， 因 此 ， 把 最 大 元 素 移 到 最 右 端 ; 如 果 这 个 
条 件 不 满足 ， 例 如 ， 当 支点 是 最 大 元 素 时 ， 第 一 个 do 循环 语句 的 结果 是 左 索 引 值 大 于 n-1。 

程序 18-7 把 数据 段 划 分 为 左 、 中 、 右 。 支 点 总 是 待 排 序数 段 的 左 元 素 。 其 实 还 可 以 选择 
性 能 更 好 的 排序 算法 。 在 本 章 后 面 ， 我 们 将 讨论 这 样 的 算法 。 


程序 18-6 ”递归 快速 排序 的 驱动 程序 

template <class T> 
woiad, TulekSGrt (T Es dnb mY 
{1 对 at0 : n - 1] 快速 排序 

if (n <= 1) return; 

/把 最 大 的 元 素 移 到 数组 右 端 

int max = indexOfMax (a,n); 

swaplaln - 1], almax]); 

ULGkKSOrt(a Qi Mm = 2)5 
} 


在 程序 18-7 的 do-while 语句 的 条 件 中 ,把 关系 操作 符 < 和 > 分别 改 为 <= 和 >=， 程 序 依 
然 正 确 (这 时 ， 数 据 段 最 右边 的 元 素 比 支点 要 大 )。 实 验 结 果 表 明 ， 程 序 18-6 的 平均 性 能 比 
较 好 。 要 去 除 递 归 ， 就 要 引入 栈 。 而 最 后 一 次 递归 调用 在 去 除 时 不 用 引入 栈 。 去 除 递归 调用 
的 算法 这 项 工作 留 作 练习 21。 


程序 18-7 ”递归 快速 排序 函数 
template <class T> 
void quickSort(T all, int leftEnd, int rightEnd) 
{1// 对 alleftEnd:rightEnd] 排序 ，a[rightEnd+1] >= al[lleftEnd:rightEnd] 
if (leftEnd >= rightEnd) return; 


int leftCursor = leftEnd, // 从 左 到 右 移动 的 索引 
rightCursor = rightEnd + 1; / 从 右 到 左 移 动 的 索引 
T pivot = alleftEnd]; 
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/将 位 于 左 侧 不 小 于 支点 的 元 素 和 位 于 右 侧 不 大 于 支点 的 元 素 交 换 
while (true) 
I 
do 
{1/ 寻找 左 侧 不 小 于 支点 的 元 素 
leftCursort+;} 
} while (la[lleftCursor] < pivot); 


do 

{W 寻找 右 侧 不 大 于 支点 的 元 素 
rightCuresor== 

} while (alrightCursor] > pivot); 


if (leftCursor >= rightCursor) break; 1/ 没有 找到 交换 的 元 素 对 
swap (a[leftCursor], al[lrightCursor]); 
} 


/放置 支点 
alleftEnd] = a[lrightCursor]; 
alrightCursor] = pivot; 


quickSort(a, leftEnd, rightCursor - 1); / 对 左 侧 的 数 段 排 
quickSort (a, rightCursor + 1, rightEnd); 1/ 对 右 侧 的 数 段 排序 
} 








3. 复杂 度 分 析 

程序 18-6 所 需要 的 递归 栈 空 间 为 O(n)。 若 使 用 栈 来 模拟 递归 ， 则 需要 的 空间 可 以 减少 为 
O(logn)。 在 模拟 过 程 中 ， 首 先 对 数据 段 left 和 right 中 较 小 者 进行 排序 ， 把 较 大 者 的 边界 放 人 和 人 
栈 中 。 

在 最 坏 情 况 下 ， 例 如 ， 数 据 段 left 总 是 空 ， 这 时 的 快速 排序 用 时 为 9(n*)。 在 最 好 情况 
下 ， 即 数据 段 left 和 right 的 元 素数 目 总 是 大 致 相同 ， 这 时 的 快速 排序 用 时 为 9(nlogn)。 而 快 
速 排序 的 平均 复杂 度 也 是 9(zxlogm， 这 是 令 人 惊奇 的 速度 。 

定理 18-2 快速 排序 的 平均 复杂 度 是 O(nlogn)， 其 中 为 排序 元 素 的 个 数 。 

证 明 令 i(n) 表示 对 元 素数 组 排序 的 平均 时 间 。 当 nn < 1 时 ,1(n) < &，d 为 常数 。 假 
设 n>1。 用 s 表示 左 数据 段 的 元 素 个 数 。 因 为 中 间 段 有 一 个 元 素 ， 所 有 右 数 据 段 的 元 素 个 数 为 
n-s-1。 因 此 ， 左 段 和 右 段 的 平均 排序 时 间 分 别 为 (s) 和 t(n-s-1)。 分 割 数组 元 素 所 需要 的 时 
间 为 crn， 其 中 c 是 一 个 常数 。 因 为 s 可 以 从 0 到 nn-1 取 任何 一 个 值 ， 而且 概率 相等 ， 所 以 得 
到 下 面 的 递归 表达 式 : 


1(n) < cn+ LS [Gs) + i(n-s—1)] 
可 将 上 式 化 简 为 : 和 
0) < en+ 2351) < ent 4 (18-11) 
对 使 用 归纳 法 ， 可 得 到 i(n) < knlogen， 其 中 n>1，k=2(c+d)。e = 2.718， 是 自然 对 数 
的 基底 。 归 纳 基 础 部 分 包括 n=2。 根 据 公 式 (18-11)， 可 以 得 到 1(2) < 2c+2d < ilog.2。 在 归 


纳 假设 部 分 ， 假 定 Km) < kn logen( 当 2 < n<m 时 ,，m 是 任意 一 个 大 于 2 的 整数 )。 在 归纳 步 
又 阶段 ， 需 要 证 明 i(m) < kon logem。 根 据 公式 (18-11) 和 归纳 假设 ， 可 以 得 到 : 





lm) < em+ M+) <omtM+ slog.s (18-12) 


为 了 进一步 证 明 的 需要 ， 我 们 需要 以 下 事实 : 
。sloges 是 s 的 一 个 递增 函数 。 


m m’ logem 2 
. fslogesds < 1 
根据 这 些 事实 和 公式 (18-12)， 可 以 得 到 : 
t(m) < em+ d+ " slog: sds < c1z 十 -7 4d + 人 站 i 7 -本 


Soni no, 六 -名 < /17 log。71 

因此 ， 人 快速 排序 范 数 quickSort 的 平均 性 能 是 O(nlogn)。 在 18.4.2 节 我 们 要 证 明 ， 每 一 

个 比较 排序 算法 ( 包括 快速 排序 ) 的 复杂 度 为 2(nlogn)。 因 此 ,快速 排序 的 平均 复杂 度 为 

O(nlogn), 图 

在 图 18-11 的 表 中 ， 对 本 书 设计 的 排序 算法 在 平均 情况 下 和 最 坏 情况 下 的 复杂 度 做 了 比较 。 

排序 算法 平均 性 能 
冒 泡 排序 m n 










最 坏 情况 下 的 性 能 









2 
计数 排序 于 nm 
插入 排序 nm mm 
选择 排序 nm nm 
堆 排序 nlogn nlogn 
归并 排序 nlogn nlogn 
快速 排序 








图 18-11 各 种 排序 算法 的 比较 


4. 三 值 取 中 快速 排序 

对 有 序 的 输入 序列 实施 快速 排序 ， 却 表现 出 最 坏 情 况 下 的 时 间 性 能 。 也 就 是 说 ， 一 个 快 
速 排序 算法 ， 它 对 有 序 表 排 序 比 对 无 序 表 排 序 要 慢 ， 这 是 让 人 痛苦 的 问题 。 不 过 ， 我 们 可 以 
解决 这 个 问题 ， 同 时 提高 快速 排序 的 平均 性 能 ， 方 法 是 根据 三 值 取 中 规则 ( median-of-three 
rule ) 选择 支点 元 素 。 

三 值 取 中 快速 排序 (median-of-three quick sort) 在 三 元 素 alleftEnd] 、a[(leftEnd+rightEnd )/2] 
和 a[rightEnd] 中 选择 大 小 居中 的 中 值 元 素 作 为 支点 元 素 。 例 如 ， 若 三 元 素 分 别 为 5,9,7， 则 取 
7 为 支点 元 素 。 为 此 ， 最 简单 的 做 法 是 将 中 值 位 置 上 的 元 素 与 元 素 a[leftEnd] 交换 ， 然 后 继续 
使 用 程序 18-6。 在 程序 18-7 中 ， 如 果 af[rightEnd] 是 中 值 元 素 ， 则 将 a[leftEnd] 和 a[rightEnd] 
交换 ， 然 后 再 将 a[leftEnd] 选 为 支点 元 素 ， 而 其 他 代码 不 动 。 

使 用 三 值 取 中 规则 对 输入 有 序 的 表 进 行 快速 排序 ， 用 时 为 O(nlogn)。 而 且 不 会 出 现 一 
个 数据 段 为 空 的 情况 ， 除 非 有 关键 字 相 同 的 元 素 。 也 就 是 说 ， 使 用 三 值 取 中 规则 可 以 保证 左 
右 两 个 数据 段 的 长 度 更 均衡 。 不 过 ,这样 的 改进 是 否 能 够 抵消 中 值 元 素 的 选择 所 花费 的 时 间 
呢 7 只 有 用 实验 来 回答 这 个 问题 。 

5. 性 能 测量 

图 18-12 中 的 表 是 根据 实验 所 得 到 的 快速 排序 的 平均 时 间 。 快 速 排序 依然 取 自 程序 18-6， 
即 中 值 元 素 选 自 数据 段 的 首 元 素 。 这 个 表 还 包括 了 归并 排序 、 堆 排序 和 插入 排序 的 平均 时 间 。 
对 每 一 个 n， 都 随机 产生 了 至 少 100 组 整数 实例 用 于 排序 。 这 些 随机 实例 是 反复 调用 C++ 函 
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数 rand 来 生成 的 。 如 果 对 这 些 实例 的 排序 时 间 少 于 一 秒 ( 见 4.4 节 )， 那 么 就 再 生成 随机 实 
例 用 以 排序 ， 直 到 排序 时 间 不 少 于 一 秒 。 在 图 18-12 的 表 中 所 显示 的 时 间 包 含 了 随机 实例 的 
生成 时 间 。 对 每 一 个 nx， 生 成 随机 实例 的 时 间 以 及 其 他 额外 用 时 ， 对 所 有 排序 法 都 是 一 样 的 。 
图 18-12 的 数据 对 于 各 种 排序 算法 的 性 能 比较 是 很 有 用 的 。 图 18-13 是 这 些 数据 构成 的 曲线 图 。 





时 间 单 位 为 毫秒 
图 18-12 各 种 排序 算法 的 平均 时 间 





f 这 
堆 排序 
i 归并 排序 
快速 排序 
0 PY 500 1000 2000 3000 4000 5000 





n 


图 18-13 各 种 排序 算法 平均 时 间 的 曲线 图 (毫秒 ) 





如 图 18-13 所 示 ， 对 于 足够 大 的 n， 快 速 排序 算法 要 比 其 他 算法 效率 更 高 。 快 速 排序 曲 
线 与 插入 排序 曲线 的 交点 横 坐 标 在 50 和 100 之 间 ， 精 确 值 可 以 通过 实验 来 确定 。 令 精确 值 为 
nBreak。 当 nn < nBreak 时 ， 插 入 排序 的 平均 性 能 最 佳 ， 而 当 n>nBreak 时 ， 快 速 排序 的 性 能 
最 佳 。 当 n>nBreak 时 ， 把 插入 排序 与 快速 排序 综合 为 一 个 排序 函数 ， 可 以 提高 快速 排序 的 性 
能 ， 综 合 的 方法 是 把 程序 18-6 的 语句 


if (leftEnd>=rightEnd) return; 


替换 为 
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if (rightEnd-leftEnd<nBreak) 

{ 
insertionSort (a, leftEnd,rightEnd); 
Peturns 


} 


这 里 insertionSort(a,leftEnd,rightEnd) 是 用 插入 排序 法 对 alleftfEnd: rightEnd] 排序 。 修 改 后 的 快 
速 排序 算法 的 性 能 测量 留 作 练习 28。 使 nBreak 取 更 小 的 值 有 可 能 使 性 能 进一步 提高 ( 见 练习 28 )。 

大 多 数 实验 表明 ， 当 n>c 时 (c 为 某 一 常数 )， 在 最 坏 的 情况 下 ， 归 并 排序 的 性 能 最 佳 。 
而 当 n < c 时， 在 最 坏 的 情况 下 ,插入 排序 的 性 能 最 佳 。 将 插入 排序 与 归并 排序 合并 ， 可 以 
提高 归并 排序 的 性 能 ( 见 练习 29 )。 

排序 方法 的 实际 运行 时 间 表 明 ， 渐 近 复 杂 度 分 析 是 有 局 限 性 的 。 例 如 ， 对 一 些小 型 实例 ， 
复杂 度 为 O(m) 的 插入 排序 方法 比 所 有 复杂 度 为 O(nlogn) 的 排序 方法 具有 更 好 的 性 能 ， 对 此 ， 
渐 近 复杂 度 分 析 并 不 能 准确 地 预测 。 那 些 渐 近 复杂 度 相 同 的 程序 ， 实 际 运行 时 间 常 常 是 不 同 的 。 

6. C++ 排序 方法 

如 果 你 要 设计 STL 排序 函数 sort， 你 应 该 怎样 做 呢 ? 图 18-12 和 图 18-13 可 能 会 令 你 左 
右 为 难 。 有 的 方法 在 最 坏 情况 下 的 性 能 最 优 ， 有 的 方法 的 平均 性 能 最 佳 ， 还 有 的 方法 是 稳定 
的 ( 它 使 两 个 相等 的 元 素 在 排序 前 后 的 次 序 不 变 )， 你 应 该 选择 哪 一 种 呢 ? 

C++ 排序 函数 的 设计 者 选择 了 平均 性 能 最 优 的 设计 ， 而 且 使 用 改变 的 快速 排序 ， 这 种 排 
序 算法 在 子 序列 的 数量 超过 对 数 logn 的 某 个 常数 倍 时 ， 使 用 堆 排 序 ， 在 数据 段 不 大 时 ， 使 用 
插入 排序 。STL 函数 stable_sort 是 归并 排序 ， 但 是 当 数据 段 不 大 时 ， 使 用 插 人 排序 。 


18.2.4 选择 


1. 问题 描述 

从 nn 元 素数 组 a[0:n-1] 中 找 出 第 小 的 元 素 。 若 a[0:n-1] 有 序 ， 则 该 元 素 便 是 a[k-1]。 
考虑 n=8 的 一 个 数组 ， 每 个 元 素 有 两 个 域 ，key 和 id， 其 中 key 是 一 个 整数 ，id 是 一 个 字符 。 
假设 这 8 个 元 素 为 [(12,a), (4,5), (5,c), (4,4), (5,e), (10, 放 ), (2,8), (20,h)]， 排 序 后 为 [(2,g), (4,q), 
(4,0), (5,c), (5,e), (10, 门 , (12,a), (20,h)]。 如 果 三 1， 返 回 id 为 g 的 元 素 ; 如 果 且 8， 返回 id 为 
h 的 元 素 ; 如 果 本 6， 返 回 id 为 了 的 元 素 ; 如 果 入 2， 返 回 id 为 4 的 元 素 。 对 最 后 一 种 情况 ， 
返回 的 元 素 可 能 不 唯一 ， 因 为 id 为 4 的 元 素 和 id 为 b 的 元 素 具有 相同 的 关键 字 ， 所 以 任何 一 
个 都 可 能 排 在 af1] 而 作为 返回 值 。 然 而 ， 如 果 一 个 元 素 在 f=2 时 被 返回 ， 那 么 另 一 个 必定 在 
k=3 时 被 返回 。 

选择 问题 的 一 个 应 用 是 寻找 中 值 元 素 。 此 时 三 |n/2]。 中 值 是 一 个 很 有 用 的 统计 量 ， 经 常 
出 现在 媒体 报道 中 ， 例 如， 中间 工 资 、 中 间 年 龄 、 中 间 高 度 ,k 为 其 他 值 时 也 是 有 用 的 。 例 如 ， 
寻找 第 n/4、n/2、3n/4 这 三 个 元 素 ， 可 以 将 人 口 划 分 为 4 部 分 。 

2. 求解 策略 和 实现 

选择 问题 可 在 O(nlogn) 时 间 内 解决 ， 方法 是 ， 首 先 对 n 个 元 素 的 数组 a[0:n-1] 排序 ( 堆 
排序 或 归并 排序 )， 然 后 取出 a[k-1] 中 的 元 素 。 使 用 快速 排序 ( 如 图 18-12 所 示 ) 可 以 获得 更 
好 的 平均 性 能 ， 尽 管 该 算法 在 最 坏 情 况 下 的 渐 近 复杂 度 比 较 差 ， 仅 为 O(n”)。 

修改 程序 18-6， 可 以 得 到 选择 问题 的 一 个 较 快 的 求解 方法 。 如 果 在 两 个 while 循环 之 后 ， 
将 支点 元 素 a[leftEnd] 交换 到 a[ 站 ,那么 afleftEnd] 便 是 a[leftEnd:rightEnd] 中 第 j-leftEnd+1 小 
的 元 素 。 如 果 要 寻找 的 第 小 的 元 素 在 aleftEnd:rightEnd] 中 ， 并 且 j-leftEnd+1 等 于 大， 那么 
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答案 就 是 a[leftEnd] ; 如 果 .j-leftEnd+1<k， 那 么 要 寻找 的 元 素 是 right 中 第 kj+leftEnd-1 小 的 
元 素 ， 否 则 是 left 中 第 小 的 元 素 。 因 此 ， 只 需 进行 0 次 或 1 次 递归 调用 。 修 改 后 的 代码 见 
程序 18-8 和 程序 18-9。 在 select 中 的 递归 调用 可 用 for 或 while 循环 来 代替 ( 练习 35 )。 


程序 18-8 ”寻找 第 上 小 的 元 素 的 预 处 理 程序 





template <class T> 
T select(T a[]，int n, int k) 
{W 返回 af[0 : n - 1] 中 第 k 小 的 元 素 
i Ll > 
throw illegalPparameterValue("k must be between 1 and n"); 


/把 最 大 元 素 移 到 最 右 端 

int max = indexOfMax (a, n); 
swap(la[ln-1], almax]); 

return select (a, 0, nn - 1, k); 


程序 18-9 ”寻找 第 k 小 的 元 素 的 递归 函数 


template <class T> 
T select(T al[l], int leftEnd, int rightEnd, int k) 
{// 返回 a[lleftEnd:rightEnd] 中 第 k 小 的 元 素 
if (leftEnd >= rightEnd) 
return al[lleftEnd]; 
int leftCursor = leftEnd, 1/ 从 左 到 右 的 索引 
rightCursor = rightEnd + 1; // 从 右 到 左 的 索引 
T pivot = alleftEnd]; 


1/ 将 左面 不 小 于 支点 的 元 素 和 右面 不 大 于 支点 的 元 素 交 换 
while (true) 
{ 
do 
{1/ 寻找 左面 不 小 于 支点 的 元 素 
leftCursort++» 
} while (a[lleftCursor] < pivot); 


do 

{1/ 寻找 右面 不 大 于 支点 的 元 素 
rightCursor-—;} 

} while (alrightCursor] > pivot); 


if (leftCursor >= rightCursor) break; 1/ 交换 的 一 对 元 素 没有 找到 
swap(a[leftCursor], alrightCursor]); 


} 


if (rightCursor - leftEnd + 1 == K) 
return pivot; 


1/ 放置 支点 元 素 
alleftEnd] = a[lrightCursor]; 
] 


a[lrightCursor] = pivot; 


1/ 对 一 个 数据 段 调用 递归 


if (rightCursor = leftEnd + 1 < k) 
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return select(a, rightCursor + 1, rightgnd, 
k= PlightCurser + LeftEnd = Ly; 
else return select(a, leftEnd, rightCursor - 1, k); 


} 


3. 复杂 度 分 析 
程序 18-8 在 最 坏 情 况 下 的 复杂 度 是 @(n”)。 所 谓 最 坏 情况 就 是 left 总 是 为 空 ， 第 小 
元 素 总 是 位 于 right。 如 果 left 和 right 总 是 一 样 大 小 或 大 小 相差 不 超过 一 个 元 素 ， 那 么 对 程 
序 18-8 使 用 时 ， 可 得 到 以 下 递归 表达 式 : 
nl 


d, 
1 1 

如 果 n 是 2 的 究 ， 那么 可 以 取消 公式 (18-13 ) 中 的 向 下 取 整 操作 符 ， 然 后 使 用 替代 方 
法 ， 可 以 得 到 x(n)=B@(n)。 如 果 选 择 支点 元 素 的 方法 更 细致 一 点 ， 那 么 在 最 坏 情 况 下 的 时 间 复 
杂 度 可 以 改进 为 9(n)。“ 中 间 的 中 间 ( median-ofmedian )” 规 则 便 是 这 样 一 种 方法 。 它 首先 根 
据 一 个 整数 >， 将 数组 a 的 n 个 元 素 分 成 |m/r| 个 组 ， 每 组 都 有 vr 个 元 素 。 可 能 剩 下 不 足 + 个 元 
素 , 个 数 是 n 除 以 r 的 余数 ,它们 不 作为 选择 支点 元 素 的 候选 。 然 后 对 每 组 的 + 个 元 素 进 行 
排序 ， 和 寻找 在 中 间 位 置 上 的 元 素 。 最 后 递归 地 使 用 选择 算法 ,在 所 得 的 |n/r| 个 中 间 元 素 中 选 
择 中 间 元 素 作 为 支点 元 素 。 

例 18-6[ 中 间 的 中 间 ] 假设 x=5, n=27， 且 a=[2, 6, 8, 1, 4, 9, 20, 6, 22, 11, 9, 8, 4, 3, 7, 8， 
16, 11, 10, 8, 2, 14, 15, 1, 12, 5, 4]。 将 数组 a 的 元 素 划分 为 5 组 [2, 6, 8, 1, 4], [9, 20, 6, 22, 11]， 
[9, 8, 4, 3, 7], [8, 16, 11, 10, 8], [2,14,15,1,12]。 和 一 余 的 元 素 是 5 和 4。 由 每 组 的 中 间 元 素 组 成 
[4, 11, 7, 10, 12]， 其 中 的 中 间 元 素 为 10。10 被 取 为 支点 元 素 。 由 此 支点 元 素 可 以 得 到 left=[2， 
6, 8, 1, 4, 9, 6, 9, 8, 4, 3, 7, 8, 8, 2, 1, 5, 4], middle=[10], right=[20, 22, 11, 16, 11, 14, 15, 12]。 
如 果 要 寻找 第 小 的 元 素 且 k<19， 则 仅仅 需要 在 left 中 寻找 ; 如 果 本 19， 则 要 找 的 元 素 就 是 
支点 元 素 10; 如 果 及 19， 则 需要 在 right 中 寻找 第 (k-19 ) 个 元 素 。 加 

定理 18-3 当 按 “中 间 的 中 间 ” 规 则 选取 支点 元 素 时 ， 如 下 结论 为 真 : 

1 ) 若 r=9， 则 对 nn 三 90， 有 max {|leftl,lright|} 二 7n/8。 

2) 若 r=5， 且 所 有 元 素 各 不 相同 ， 则 对 nn 宇 24， 有 maxtlleft|,，|rightl} < 3n/4。 

证 明 ”这 个 定理 的 证 明 留 作 练习 33。 国 

根据 定理 18-3 和 程序 18-8 可 知 ， 若 在 “中 间 的 中 间 ” 规 则 中 选用 天?， 则 寻找 第 大 小 的 
元 素 的 时 间 t(n) 可 按 如 下 递归 公式 来 计算 : 
cnlogn, n< 90 
ee n>90 Bo 
其 中 c 是 一 个 常数 。 根 据 公 式 (18-14 )， 当 n<90 时 ， 使 用 复杂 度 为 nlogn 的 算法 ， 当 nn 宇 90 
时 ， 使 用 带 有 “中 间 的 中 间 ” 规 则 的 分 而 治之 算法 。 利 用 归纳 法 可 以 证 明 (练习 34)， 当 
n 宇 1 时， 有 1(n) < 72cn。 当 元 素 互 不 相同 时 ,使 用 r=5 可 以 得 到 线性 时 间 性 能 。 


18.2.5 ”相距 最 近 的 点 对 


1. 问题 描述 
给 定 n 个 点 (xsyi) (1 < i < n),， 要 求 找 出 其 中 相距 最 近 的 两 个 点 。 两 点 i 和 j 之 间 的 路 
离 公式 如 下 : 


(18-13) 
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VC=x) + y) 

例 18-7 ”假设 在 一 块 金属 板 上 钻 半 个 大 小 一 样 的 孔 。 如 果 两 孔 相 距 太 近 ， 那 么 在 外 孔 
时 ， 金属 板 就 可 能 断裂 。 若 能 够 确定 相距 最 近 的 两 个 孔 之 间 的 距离 ， 那 么 就 可 以 估算 金属 板 
发 生 断 裂 的 概率 。 加 

2. 求解 策略 

考察 所 有 n(n-1)/2 个 点 对 ， 计 算 每 一 个 点 对 之 间 的 距离 ， 然 后 确定 相距 最 近 的 一 个 点 对 。 
这 个 过 程 所 需 时 间 为 O(n*)。 这 种 方法 称 为 直接 法 ( direct approach )。 还 有 一 种 方法 是 分 而 治 
之 法 ， 图 18-14 是 对 这 种 方法 的 简单 描述 。 


if (7 不 大 ) 


用 直接 方法 寻找 相距 最 近 的 点 对 。 
return; 
} 
/in 很 大 
把 点 集 分 成 大 致 相等 的 两 部 分 4 和 B。 
分 别 确定 4 和 8B 中 相距 最 近 的 点 对 。 
确定 一 点 在 4 另 一 点 在 B 的 相距 最 近 的 点 对 。 
在 上 面 得 到 的 相距 最 近 的 三 个 点 对 中 ， 选 择 相 距 最 近 的 一 对 





图 18-14 寻找 最 近 的 点 对 


分 而 治之 法 对 小 实例 用 直接 法 求解 ， 对 大 实例 进行 划分 ， 划 分 为 两 个 较 小 的 实例 。 一 个 
实例 称 为 4， 其 大 小 为 [m21， 男 一 个 实例 称 为 B， 其 大 小 为 [mn/2|]。 于 是 ， 相 距 最 近 的 点 对 来 
自如 下 三 类 点 对 之 一 : 1 ) 两 点 都 在 4 ; 2 ) 两 点 都 在 B; 3 ) 一 点 在 4， 男 一 点 在 B。 首 先 在 
每 一 类 中 确定 一 个 相距 最 近 的 点 对 ， 然 后 从 得 到 的 三 个 点 对 中 确定 相距 最 近 的 点 对 。 对 第 一 
类 和 第 二 类 点 对 ， 可 以 用 递归 方法 来 查找 其 中 相距 最 近 的 点 对 。 

对 第 三 类 点 对 中 相距 最 近 的 点 对 ， 需 要 用 一 种 不 同 的 方法 来 查找 。 这 种 方法 取决 于 小 实 
例 的 划分 方式 。 一 个 合理 的 划分 方式 是 沿 中 值 点 x; 画 一 条 垂 线 ， 把 金属 板 划 分 为 左右 两 部 分 ， 
在 垂 线 左边 的 点 属于 4， 在 垂 线 右 边 的 点 属于 有。 把 垂 线 上 的 点 在 4 和 中 之 间 分 配 ， 以 平衡 
4 和 8B 的 大 小 。 

例 18-8 图 18-15a 有 14 个 点 ， 从 a 到 n， 它 们 被 标示 在 图 18-15b 中 。 中 值 点 xF=1， 垂 
线 x=1， 如 图 18-15b 中 的 虚线 所 示 。 在 虚线 左边 的 点 有 b、c、h、n、i， 它 们 属于 4， 在 虚线 
右边 的 点 有 a、e、 矿 j、k、1， 它们 属于 8B。 在 虚线 上 的 点 有 4、g、m; 假 设 把 d、m 分 配给 4， 
g 分 配给 B， 这 样 一 来 ,，4 和 8B 各 具 7 个 点 。 国 

在 4 中 相距 最 近 的 点 对 的 间距 和 B 中 相距 最 近 的 点 对 的 间距 有 一 个 较 小 者 ， 我 们 设 其 为 
56。 要 在 第 三 类 点 对 中 寻找 一 个 点 对 ， 其 间距 比 5 小 ， 那 么 这 个 点 对 的 每 一 个 点 距 垂 线 的 距 
离 都 要 比 5 小 。 因 此 ， 那 些 距 垂 线 距离 不 小 于 6 的 点 都 可 以 排除 。 图 18-16 的 虚线 是 分 割 线 。 
阴影 区 域 以 分 割 线 为 中 线 ， 宽 度 为 25。 在 阴影 区 域 的 边界 线 上 和 边界 线 以 外 的 点 均 被 排除 ， 
只 有 在 阴影 区 域 里 的 点 被 保留 下 来 ， 在 其 中 确定 是 否 存在 一 个 第 三 类 的 点 对 ， 其 间距 小 于 5。 

令 Rs 和 Rs 分 别 表示 在 4 和 8B 中 被 保留 下 来 的 点 。 如 果 存 在 一 个 点 对 (p,q )， 满 足 
PEA,9gEB 且 p 和 9 间距 小 于 6, 则 p E Rs,g ERs。 为 了 寻找 这 种 点 对 ， 每 次 考察 Ri 
中 的 一 个 点 。 假 设 考察 的 是 Rs 中 的 点 p, p 的 yy 坐标 为 p.y。 然 后 我 们 只 需 在 Rs 中 查看 那些 
其 y 坐标 与 p.y 的 距离 小 于 6 的 点 qg， 即 p.y-6<q.y<p.y+6， 因 为 内 有 这 样 的 点 gqg， 才 可 能 与 p 
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构成 其 间距 小 于 6 的 点 对 。 在 Rs 中 包含 这 些 点 4 的 区 域 如 图 18-17a 所 示 。 最 后 ， 将 5x26 阴 
影 区 域内 的 点 逐个 与 p 配对 ,确定 是 否 构 成 其 间距 小 于 6 的 第 三 类 点 对 。 这 个 6x26 区 域 称 为 
Pp 的 比较 区 ( comparing region )。 
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b) 点 的 分 布 
图 18-15 具有 14 个 点 的 实例 





























x i 
x 
po 由 25 
x | 
x 
6 
用 X 表 示 的 点 被 排除 b) 
图 18-16 排除 距 分 割 线 很 远 的 点 图 18-17 p 的 比较 区 


例 18-9 考察 例 18-8 的 14 个 点 。4 中 相距 最 近 的 点 对 为 (4b,h) ,其 间距 约 为 0.316。B 
中 相距 最 近 点 对 为 (fj ) ,其 间距 为 0.3。 因 此 5=0.3。 接 下 来 考察 是 否 存在 一 个 间距 小 于 5 
的 第 三 类 点 对 ， 这 时 ， 除 4、g、i、1、m 以 外 的 点 均 被 排除 ， 因 为 它们 距 分 割 线 x=1 的 距离 
都 6。 于 是 有 Rs={dim}，Rs={g,1}。 由 于 4d 和 g 的 比较 区 没有 点 ， 所 以 只 需 考 察 i 的 比较 
区 即 可 。i 的 比较 区 仅 有 一 个 点 1， 且 与 i 的 距离 小 于 5， 因 此 (i,1) 是 相距 最 近 的 点 对 。 国 

因为 在 5 x 26 比较 区 的 边界 或 内 部 ， 所 有 点 的 间距 至 少 为 5， 所 以 这 些 顶 点 数量 不 超过 6 
个 。 图 18-17b 显示 了 唯一 的 方法 ， 用 来 确定 间距 最 小 为 6 的 6 个 点 。 因 此 ， 在 确定 一 个 间距 
更 短 的 第 三 类 点 对 ， 只 需 将 Rs 的 每 个 点 和 Rs 中 最 多 6 个 点 比较 。 

3. 选择 数据 结构 

为 了 实现 图 18-14 的 分 而 治之 算法 ， 需 要 明确 什么 是 “小 实例 ”以 及 如 何 表 示 其 中 的 点 。 
因为 少 于 两 个 点 的 集合 不 存在 点 对 ， 所 以 小 实例 要 少 于 4 个 点 。 
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用 四 个 结构 表示 点 。 结 构 point 有 两 个 数据 成 员 x 和 y， 分 别 存储 点 的 x 坐 标 和 y 坐标 。 
第 二 个 结构 pointl 从 结构 point 中 派生 ， 它 增加 了 一 个 整 型 的 数据 成 员 id， 而 且 定 义 了 一 个 向 
double 型 的 类 型 转换 ， 返 回 点 的 x 坐标 。 利 用 这 个 类 型 转换 ， 可 以 对 点 序列 按照 x 坐标 的 递 
增 顺 序 归并 排序 ( 程序 18-3 )。 第 三 个 结构 point2 也 从 point 派生 ， 它 增加 了 一 个 整 型 的 数据 
成 员 p， 它 的 意义 将 在 下 面 描述 。 结 构 point2 定义 了 一 个 向 double 型 的 类 型 转换 ， 返回 点 的 
y 坐标 。 利 用 这 个 类 型 转换 ， 我 们 可 以 对 点 序列 按照 y 坐标 的 递增 顺序 归并 排序 。 第 四 个 结 
构 也 是 最 后 一 个 结构 是 pointPair， 它 有 数据 成 员 a ( 点 对 的 第 一 个 点 )、b (点 对 的 第 二 个 点 ) 
和 dist ( 点 a 和 b 的 距离 ),。a 和 ob 的 类 型 是 pointl1，dist 的 类 型 是 double。 

输入 的 点 序列 存储 在 类 型 为 pointl 的 数组 x 中 。 假 设 数组 x 中 的 点 已 经 按照 x 坐标 有 序 。 
如 果 要 划分 x[1:]， 那 么 由 m=(1+r)/2， 得 到 4 是 x[1:m]，B 是 [m+l:7]。 

在 分 别 计算 出 4 和 8B 中 相距 最 近 的 点 对 之 后 ,计算 Rs4 和 Rs， 然后 确定 是 否 存 在 相距 更 
近 的 点 对 ， 其 中 一 点 在 R4， 另 一 点 在 Rs。 如 果 点 序列 按 y 坐标 排序 ， 那 么 实现 图 18-17 的 算 
法 可 以 很 简单 。 按 y 坐标 排序 的 点 序列 存储 在 类 型 为 point2 的 另 一 个 数组 中 ， 在 结构 point2 
中 定义 的 类 型 转换 有 助 于 对 点 序列 按 y 坐标 进行 排序 ， 数 据 成 员 p 是 点 在 数组 x 中 的 索引 。 

4. C++ 实现 

确定 了 必要 的 数据 结构 之 后 ， 我 们 来 编写 代码 。 首 先 定义 一 个 函数 dist ( 见 程 序 18-10 )， 
计算 两 点 之 间 的 距离 。 注 意 ， 虽 然 函 数 dist 的 参数 类 型 是 point， 但 是 对 类 型 为 pointl 或 point2 
的 两 个 点 ， 这 个 函数 也 可 以 用 来 计算 它们 的 距离 ， 因 为 pointl 和 point2 都 是 point 的 派生 类 。 


程序 18-10 ”计算 两 点 距离 


double dist(const Point& u, const Point& v) 
{/ 返回 点 u 和 wv 的 距离 

double dx=u.x-V.x;? 

double dy=u.y-v.y; 

return Sqrt (dx * dxtdy * Qy)s 
} 


考察 程序 18-11 的 函数 closestPair。 如 果 点 的 数目 少 于 2， 则 函数 抛 出 异常 ， 否 则 返回 相 
距 最 近 的 点 对 。 在 确定 了 至 少 有 两 个 点 之 后 ， 用 归并 排序 sergeSort ( 程序 18-3 ) 对 x 中 的 点 
按 x 坐标 排序 。 然 后 把 这 些 点 复制 到 类 型 为 point2 的 数组 y 并 且 按 y 坐标 排序 。 在 数组 y 排 
序 之 后 ，y[il.y < y[i+1].y， 且 对 每 一 个 1i，y[i].p 表示 点 i 在 数组 x 中 的 位 置 。 在 上 述 准备 工 
作 做 完 以 后 ， 调 用 函数 程序 18-12 的 递归 因数 closestPair， 实 际 确定 相距 最 近 的 点 对 。 


程序 18-11 ”递归 函数 closestPair 的 驱动 程序 
pointPair ClosestPair (Point1l x[], int numberOfPoints) 
{// 返回 x[0:numberOfPoints-1] 中 相距 最 近 的 点 对 
1/ 如 果 点 的 个 数 少 于 2， 则 抛 出 异常 
int n = numberOfPoints; 
EE Ch 
throw illegalParameterValue ("Number of points must be > 1");} 





1/ 按 x 坐标 排序 


mergeSort (x, n); 


// 创建 一 个 类 型 为 point2 的 数组 y， 按 y 坐标 排序 


Point2 *y = new point2 I[n]; 
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EGF (nt B= QF EE < nN: i++) 

1/ 把 点 谍 从 x 复制 到 y， 且 记录 i 在 数组 x 中 的 索引 

¥[lE] = Eoint2 (x[i] sx XI] sy ds 
mergeSort(y, n); 1// 按 yy 坐标 排序 


1// 创建 一 个 临时 数组 


point2 *z = new point2 [n]; 


1/ 寻找 相距 最 近 的 点 对 


return closestPair (x yY2r 0 n= 1)? 


程序 18-12 ”确定 相距 最 近 的 点 对 
pointpPair closestPair (pointl ¥[], point2 y[], point2 z{i, int 1, int rz) 
{1/ 按 x 举 标 对 x[1:r] 排序 ,， r > 1 
/ 按 y 坐 标 对 Y[1:z] 排序 
1/z[l:r] 用 作 临 时 空间 
1/ 返回 在 x[1:r] 中 相距 最 近 的 点 对 


位 王 工 ED 1/ 仅 有 两 个 点 
return pointPair(xtl], x[lr], Gist(x[l], x[lrel))s 
if (rtr - 1 == 2) 


{1/ 有 三 个 点 。 计 算 所 有 点 对 之 间 的 距离 
double dl = dist(x[1], x[l1 + 1]); 
double d2 = dist(x[l1 + 1], x[r]); 
double d3 = dist(x[1], x[r]); 
/寻找 相距 最 近 的 点 对 
if (dl <= d2 && dl <= d3) 
return pointPair(x[1], x[l1 + 1], dl1); 
if (d2 <= d3) 
return pointPair(x[l1 + 1], x[r], d2); 
else 
return pointPair(x[1], x[r], d3); 
} 


// 多 于 三 个 点 ， 划 分 为 两 组 


int m= (T+ 7 2 1/ 将 x[1:m] 归于 A， 其 余 归 于 B 
/将 有 序数 组 y 分 前 后 两 部 分 复制 到 z[1:m] 和 zf[m+l:rl 
VE 二 /用 于 z[L:ml] 的 索引 
g=m+1; /用 于 z[m+1l:z] 的 索引 
E60 (LE = 
if (lis > mW [g++*] SE Li] 
else z[f++] = yl[i]; 
// 分 别 在 两 部 分 中 求解 相距 最 近 的 点 对 


pointPair best = closestPair(x,zZ,y, 1, m); 
PointPair right = closestPair(x,Z,y, m+ 1, r); 


1/ 确定 相距 更 近 的 点 对 
if (right.dist < best.dist) 
best = righty 


merge(z,y, 1, m, r); 1/ 把 z 归并 到 Yy， 重 建 数组 y 
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1 把 距 中 线 更 近 的 点 放 入 数组 z 
nt Kk: =: Ly /数组 z 的 下 标 
for (int Y= 1Y i as ry d+) 
if (fabs (x[m] .x = yli] .x) < best.dist) 
z[kK++] = y[i]; 


1/ 检查 z[1:k-1] 的 所 有 点 对 ， 寻 找 相距 更 近 的 第 三 类 点 对 
EO (iN 页 三 :了 工交 大 5 开 书 4) 
for (nt 本 二 主机 工 kk && 芭 加 ]. 一 己 了 .YY < Dest .dists j++) 
{ 
double dp = dist(z{i],z[j]); 
if (dp < best.dist) / 找到 相距 更 近 的 点 对 
best = pointPair (x[z[i].p], x[z[j].p], dp); 
} 
} 
return best; 


} 


递归 函数 closestPair ( 见 程 序 18-12 ) 从 点 序列 x[1:r] 中 确定 相距 最 近 的 点 对 。 假 定点 序 
列 在 x[1:r] 中 已 经 按 x 坐标 有 序 ， 在 y[1:r] 中 按 y 坐标 有 序 。z[1:r] 用 来 存放 中 间 结 果 。 一 找 
到 相距 最 近 的 点 对 ， 就 将 它 作 为 结构 pointPair 的 一 个 实例 返回 ， 然 后 将 数组 y 恢复 到 输入 状 
态 。 该 函数 不 修改 数组 x。 

首先 考察 “小 实例 ”， 即 少 于 四 个 点 的 点 序列 。 因 为 划分 过 程 不 会 产生 少 于 两 点 的 数组 ， 
因此 只 需要 处 理 两 个 点 和 三 个 点 的 情形 。 对 于 这 两 种 情形 ， 可 以 计算 所 有 点 对 的 间距 ， 然 后 
确定 相距 最 近 的 点 对 。 当 点 数 超过 三 个 时 ， 先 计算 m=(1+r)/2， 然 后 把 实例 划分 为 两 个 小 实例 
4 和 B，A4 包含 子 序列 x[1:m]，B 包含 子 序列 x[m+1:r]。 接 下 来 需要 创建 分 别 与 4 和 8B 对 应 ， 
但 是 按 y 坐标 排序 的 子 序列 z[1:m] 和 zfm+1:r]， 为 此 从 左 至 右 扫描 数组 y 中 的 点 ， 把 属于 4 的 
点 归 入 z[i:m]， 属于 8B 的 点 归 入 z[m+1:r]。y 和 z 的 角色 在 递归 调用 中 是 互相 交换 的 。 依 次 执 
行 两 个 递归 调用 ,分 别 得 到 4 和 B 中 相距 最 近 的 点 对 。 在 两 次 递归 调用 返回 后 ，z 肯定 不 会 改 
变 , 但 y 可 能 改变 。 通 过 把 z[1:m] 和 zfm+1:r] 归并 到 y[1:r] ( 见 程 序 18-5 )， 可 以 重 构 y[1:r]。 

为 实现 图 18-17 的 策略 ， 首 先 扫 描 y[1:r]， 把 其 中 距 分 割 线 小 于 5 的 点 ( 见 图 18-16 ) 收 
集 到 z[1:k-1] 中 。 在 Rs 中 的 每 一 个 点 p， 与 其 比较 区 的 所 有 点 的 配对 可 分 为 两 部 分 : 1 ) 与 
Rs 中 yy 坐标 py 的 点 配对 ;2) 与 ?坐标 入 py 的 点 配对 。 具 体 的 做 法 是 ， 将 每 个 点 zi] 
(1 i<k, 不 管 该 点 是 在 Rs 还 是 在 Re 中 ) 与 点 zD] (i<j， zy-z[i]y<6) 配对 。 对 每 一 个 
z[ 四 ,在 25x6 区 域内 所 检查 的 点 如 图 18-18 所 示 。 因 为 在 每 一 个 5x6 子 区 内 的 点 ， 其 间距 至 
少 为 56， 所 以 每 一 个 子 区 点 不 会 超过 4 个。 因此 与 z[i] 配对 的 点 z[] 最 多 有 7 个。 
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图 18-18 与 z[i] 配对 的 点 的 区 域 





5. 复杂 度 分 析 
令 1(n) 表示 递归 函数 closestPair 在 处 理 n 个 点 时 所 需要 的 时 间 。 当 n<4 时 ，xz) 等 于 某 个 
常数 q。 当 n 三 4 时 ， 需 花 费 B(n) 时 间 来 完成 以 下 工作 : 把 大 实例 划分 为 两 个 小 实例 ， 两 次 
递归 调用 后 重 构 y， 把 远离 分 割 线 的 点 排序 ， 寻 找 相 距 更 近 的 第 三 类 点 对 。 两 次 递归 调用 分 
别 用 时 为 <( fy2] ) 和 [mn/2] )， 因 此 得 到 如 下 递归 式 : | 
n<4 


‘mn <{ 
A it(ln/2|)+t([n/2|)+en, n>4 

这 个 递归 式 与 归并 排序 的 递归 式 完 全 一 样 ， 其 结果 为 i(n)=B(nlogn)。 男 外 ， 程 序 18-11 
的 驱动 程序 closestPair 还 需 用 时 B@(nlogn) 来 完成 如 下 预备 工作 : 对 x 排序、 创建 y 和 z、 对 y 
排序 。 因 此 ， 在 无 异常 的 情况 下 ， 用 分 而 治之 算法 寻找 相距 最 近 的 点 对 需要 用 时 B(nlogn)。 


练习 


8. 编写 一 个 完整 的 残缺 棋盘 问题 的 求解 程序 ， 提 供 以 下 模 决 : 欢迎 用 户 使 用 本 程序 、 输 入 棋 
盘 大 小 和 残缺 方 格 的 位 置 、 输 出 覆盖 后 的 棋盘 。 输 出 棋盘 时 要 着 色 ， 共 享 同 一 边界 的 覆盖 
应 着 不 同 的 颜色 。 棋 盘 是 平面 图 ， 因 此 最 多 只 需 4 种 颜色 为 覆盖 着 色 。 本 练习 要 求 设计 贪 
禁 着 色 启 发 式 方法 ， 以 尽量 使 用 较 少 的 颜色 。 

9. 用 替代 方法 求解 递归 式 公式 (18-7 )。 

10. flx) = Vx 是 否 满足 公式 ( 18-9 ) ? 

11. 证 明 f(x) =x*log’x 对 a 三 1、 整数 b 三 0 和 x 宇 1， 满足 公式 (18-9 )。 

12. 从 数组 [11,2,8,3,6,15,12,0,7,4,1,13,5,9,14,10] 开始 ， 模 仿 图 18-9 画图 ， 显 示 归 并 排序 的 步骤 。 

13. 基于 数组 [11.3,8,7,5,10,0,9,4,2,6,1]， 再 做 练习 12。 

14. 编写 一 个 对 链表 的 归并 排序 函数 。 输 出 排序 后 的 链表 。 使 该 函数 成 为 类 chain 或 其 扩展 类 

( 6.1 节 ) 的 一 个 成 员 函 数 。 
15. 从 数组 [2,3,6,8,11,15,0,7,12,1,4,13,5,9,10,14] 开始 ， 模 仿 图 18-9 画图 ， 显 示 自 然 归并 排序 
的 步骤 。 

16. 基于 数组 [11,3,8,5,7,10,0,9,2,4,6,1]， 再 做 练习 15。 

17. 编写 函数 naturalMergerSort 实现 自然 归并 排序 。 其 中 输入 和 输出 的 布局 与 程序 18-3 的 相同 。 

18. 编写 一 个 对 链表 的 自然 归并 排序 函数 。 使 该 函数 成 为 类 chain 或 其 扩展 类 (6.1 节 ) 的 一 

个 成 员 函 数 。 
19. 从 数据 段 [5,3,8,4,7,1,0,9,2,10,6,11] 开始 ， 画 图 显示 在 程序 18-7 中 while 循环 的 每 一 次 交换 
之 后 的 数据 段 布局 。 显 示 以 5 为 支点 元 素 的 数据 段 。 

. 使 用 数组 [7,3,6,8,11,14,0,2,12,1,4,13,5,9,10,15] 做 练习 19。 以 7 为 支点 元 素 。 

.用 一 个 while 循环 来 替换 程序 18-7 的 最 后 一 个 递归 调用 quickSort。 比 较 修 改 后 的 函数 与 

程序 18-7 的 平均 运行 时 间 。 

22. 重 写 程序 18-6 和 程序 18-7， 用 栈 来 模拟 递归 。 在 栈 中 只 需 保 存 数据 段 left 和 right 的 较 大 

者 的 边界 。 
1 ) 证 明 所 需 栈 空间 大 小 为 O(logn)。 
2 ) 比较 非 递 归程 序 和 递归 程序 的 平均 运行 时 间 。 
23. 证 明 在 最 坏 情 况 下 quickSort 的 时 间 复 杂 度 为 (mr)。 
24. 假设 按 如 下 方式 进行 left、middle 和 right 的 划分 :车 为 奇数 ， 则 left 与 right 的 大 小 相同 ; 
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27. 
.在 快速 排序 一 节 的 结尾 ， 我 们 建议 将 快速 排序 与 插 人 排序 相 结合 。 结 合 后 的 算法 实质 上 
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30; 


31. 
32. 
33. 
. 用 归纳 法 证 明 ， 公 式 ( 18-14 ) 蕴含 着 不 等 式 t(n) < 72cn, 7 三 1。 

. 程序 18-8 和 程序 18-9 所 需 递归 栈 空间 为 0(n)， 其 中 n 是 元 素 个 数 。 如 果 用 一 个 while 或 


3 
3 


un 上 
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若 为 偶数 ， 则 left 比 right 多 一 个 元 素 。 证 明 在 这 种 假设 条 件 下 ， 程 序 18-6 的 时 间 复 杂 


度 为 O(nlogn)。 
m logem mm’ 


. 证 明 | slog.sds = 二 = 所 并 利用 该 结果 证 明 |。 logssds < 一 
20. 


在 “中 间 的 中 间 ” 规 则 使 用 和 不 使 用 两 种 情况 下 ， 比 较 程 序 18-7 的 最 坏 复杂 度 和 平均 复 
杂 度 。 取 适当 的 测试 数据 ， 数 据 个 数 n=10,20,…,100,200,300,400,500,1000。 
采用 随机 产生 的 数 作为 支点 元 素 ， 完 成 练习 26。 


仍 是 快速 排序 ， 只 是 当 排 序 部 分 小 于 等 于 changeOver=nBreak 时 执行 插入 排序 。 能 否 使 
用 一 个 changeOver 的 不 同 值 而 得 到 更 快 的 算法 ? 为 什么 ? 使 用 “三 值 取 中 ”规则 修改 程 
序 18-7; 试用 changeOver 的 不 同 值 进行 实验 。 确 定 可 使 平均 性 能 最 佳 的 changeOver 的 值 。 
在 优化 快速 排序 代码 之 后 ， 比 较 它 和 C++ STL 函数 sort 的 平均 性 能 。 


.设计 一 个 在 最 差 情 况 下 性 能 最 好 的 排序 算法 。 


1 ) 比较 插入 排序 、 冒 泡 排序 、 选 择 排 序 、 堆 排序 、 归 并 排序 和 快速 排序 在 最 坏 情况 下 的 
运行 时 间 。 使 插入 排序 、 冒 泡 排 序 、 选 择 排序 和 快速 排序 出 现 最 坏 复 杂 度 的 输入 数据 
很 容易 产生 。 试 编写 一 个 程序 ， 用 来 产生 使 归并 排序 出 现 最 坏 复 杂 度 的 输入 数据 。 这 
个 程序 本 质 上 是 将 n 个 有 序 元 素 “ 反 归并 ”。 对 于 堆 排 序 ， 用 随机 排列 数据 来 估算 最 坏 
情况 下 的 时 间 复 杂 度 。 

2 ) 利用 1) 中 的 结果 设计 一 个 综合 排序 函数 ， 它 具有 最 坏 情 况 下 的 最 佳 性 能 。 这 个 函数 
很 可 能 只 包含 归并 排序 和 插入 排序 。 

3 ) 实验 测试 综合 排序 函数 在 最 坏 情 况 下 的 运行 时 间 ， 并 与 原 排 序 函 数 和 STL 函数 stable_ 
sort 进行 比较 。 

4 ) 用 一 个 图 表 标 识 出 8 种 排序 函数 在 最 差 情 况 下 的 运行 时 间 。 

从 数组 [4,3,8,5,7,10,0,9,2,11,6,1] 开始 ， 画 图 说 明 程序 18-8 和 程序 18-9 在 起 始 入 7 时 的 处 

理 过 程 。 显 示 每 一 次 划分 之 后 的 数据 段 ， 并 且 给 出 大 的 新 值 。 

基于 数组 [7,3,6,8,11,15,0,2,12,1,4,13,5,9,10,14] 和 k=5， 做 练习 30。 

当 n 是 2 的 寡 时 ， 用 替代 方法 求解 公式 ( 18-13 )。 

证 明定 理 18-3。 


for 循环 代替 递归 调用 ， 那么 可 以 完全 消除 递归 栈 空间 。 根 据 这 种 思想 重 写 程序 。 比 较 这 
两 种 选择 排序 函数 的 运行 时 间 。 

1 ) 重 写 程序 18-9， 用 随机 数 生成 器 选择 支点 元 素 。 用 实验 比较 这 两 种 代码 的 平均 性 能 。 

2 ) 重 写 程序 18-9， 使 用 “中 间 的 中 间 ” 规 则 ， 其 中 r=9。 

为 了 提高 程序 18-12 的 执行 速度 ， 可 以 用 距离 的 平方 代替 开 方 运算 ， 结 果 是 一 样 的 。 为 
此 ， 程 序 18-12 必须 做 哪些 改变 ? 通过 实验 来 比较 改进 后 的 性 能 。 

当 所 有 点 都 在 一 条 直线 上 时 ， 编 写 一 个 更 快 的 算法 来 寻找 相距 最 近 的 点 对 。 例 如 ， 假 设 所 
有 点 都 在 一 条 水 平 线 上 。 如 果 这 些 点 按 x 坐标 排序 ， 则 相距 最 近 的 两 个 点 必 相 邻 。 虽 然 使 
用 归并 排序 函数 mergerSort ( 见 程序 18-3 ) 来 实现 这 种 策略 时 的 复杂 度 仍然 是 O(nlogn)， 
但 是 这 种 算法 的 额外 开销 要 比 程 序 18-11 小 得 多 ， 因 此 运行 也 更 快 。 

考察 相距 最 近 点 对 问题 。 假 设 初 始 时 不 是 根据 x 坐标 来 排序 ， 而 是 使 用 函数 select ( 见 程 
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序 18-8 ) 来 寻找 中 点 x;， 然 后 将 点 集 划 分 为 子 集 4 和 B。 
1 ) 间接 描述 这 种 算法 。 

2 ) 算法 的 复杂 度 是 多 少 ? 

3 ) 新 算法 是 否 比 程序 18-12 更 快 。 


18.3” 解 递归 方程 


求解 递归 方程 有 若干 个 技术 : 替代 法 、 归 纳 法 、 特 征 根 法 和 生成 函数 法 。 在 本 书 的 网 站 
上 有 这 些 方法 的 细节 。 本 节 描 述 了 一 个 查 表 法 ， 可 以 用 来 求解 许多 与 分 而 治之 算法 有 关 的 递 
归 方 程 。 
很 多 分 而 治之 算法 的 时 间 复 杂 度 是 用 一 个 递归 方程 式 表 示 的 : 
_ | xD) = A 
a n>1 nt 
其 中 a、4。 为 已 知 常数 。 假 设 KM1) 已 知 ， 且 7 为 尺 的 寡 ( 即 二 六 )。 利 用 和 迭代 法 ( 见 本 书 网 站 ) 
可 以 证 明 : 
t(n)=n [1(1)+f (7)] (18-16 ) 
其 中 An)= >nb) 和 h(n)=g(n)/n"e。 
在 图 18- 19 的 列表 中 ， 对 h(n) 的 各 种 不 同 值 给 出 了 J(n) 的 渐 近 值 。 根 据 这 张 表 ， 在 分 析 
分 而 治之 算法 时 ， 可 以 很 容易 得 到 许多 递归 方程 式 中 i(n) 的 渐 近 值 。 
考察 一 些 递归 方程 式 的 例子 。 当 n 是 2 的 需 时 ， 二 又 搜索 的 递归 方程 为 : 


_ jz(1) n=1 
-| n>1 


将 这 个 递归 式 与 公式 (18-14 ) 比较 ,可知 a=1，b=2，g(n)=c。 因 而 logsa=0，h(n)=g(n)/ 
n=c=c(logn) ”=O@((logn)")。 根 据 图 18-19 可 知 ,f(n)=O(logn)。 因 而 tn)=n"(c+O(logn))= 
O(logn)。 


名 


O(nm),r<0 O(1) 


O((logn)'),i=0 EO(((logn)" )/(i+1)) 
Q(n"),r>0 O(h(n)) 





图 18-19 f(n) 与 h(n) 的 对 应 值 


对 于 归并 排序 ， 有 a=2，4b=2，g(n)=cn。 于 是 ，logsa=1，h(n)=g(n)/n=c=OB((logn)")。 因 此 
f/(n)=O(logn) Hin)=n(t(1)+O(0gn))=O(nlogn)。 

考察 另外 一 个 例子 ， 其 递归 式 如 下 : 

1(n)=71(n/2)+18n"?， 天 伺 2 且 为 2 的 宕 
该 表达 式 与 三 1 且 c=18 时 的 Strassen 矩阵 乘法 的 递归 表达 式 (公式 (18-6)) 对 应 。 因 而 
得 到 a=7，b=2，g(n)=18m。 因 此 logsa=log27 = 2.81，h(n)=18nYnr927=18n**927-O(n”))， 其 中 
1=2-log27 二 0。 因 而 f(n)=O(1)。i(n) 的 表达 式 为 
1(n)=n""(t(1)+O0(1)=O(n"") 


假设 x(1) 为 常数 。 
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最 后 一 个 例子 ， 考 虑 下 面 的 递归 式 : 
1t(n)=91(n/3)+4n*"，n 宇 3 且 为 3 的 短 
将 这 个 递归 式 与 公式 (18-14 ) 比较 ， 可 以 得 到 a=9，b=3，g(n)=4n"。 因 此 logsa=2，h(n)=4n*/ 
R=4n'=Q(m)。 根 据 图 18-13 可 知 ，f(n)=B(h(n))=B(n')。 因 而 
Un)=m (A(1)+O(n"))=O(n") 
其 中 7(1) 假设 为 常数 。 


练习 


40. 用 替代 法 证 明 公 式 ( 18-16 ) 是 递归 公式 ( 18-15 ) 的 解 。 
41. 根据 图 18-19 的 表 求 解 以 下 递归 式 。 假 定 在 每 种 情况 下 都 有 1(1)=1。 


1 ) 1(n)=101(n/3)+11n, 有 二 3 且 为 3 的 若 。 
2 ) #1(n)=101(n/3)+11n,, n 三 3 且 为 3 的 震 。 
3 ) tn)=27i(n/3)+11n,, n 三 3 且 为 3 的 窜 。 
4 ) 1(n)=641(n/4)+10nmlog’n, nn 三 4 是 为 4 的 知 。 
5 ) 1(n)=91(n/2)+n2", 17 三 2 且 为 2 的 震 。 
6 ) 1(n)=31(n/8)+n’2"logn, n 三 8 且 为 8 的 震 。 
7 ) 1(n)=1281(n/2)+6n, 1 三 2 且 为 2 的 寡 。 
8 ) 1(n)=1281(n/2)+6n’, n 三 2 且 为 2 的 寡 。 
9 ) 1(n)=128t(n/2)+2"/n, 1 三 2 且 为 2 的 震 。 
10 ) 1(n)=128i1(n/2)+log™n, n 三 2 且 为 2 的 震 。 


18.4 复杂 度 的 下 限 


f(n) 是 一 个 问题 的 复杂 度 上 限 (upper bound)， 当 且 仅 当 对 该 问题 至 少 有 一 个 复杂 度 
为 O(f(n)) 的 算法 。 为 使 一 个 问题 的 复杂 度 上 限 ,Aa) 成 立 ， 一 种 方法 是 设计 一 个 复杂 度 为 
O(f(n)) 的 算法 。 本 书 的 每 一 个 算法 对 它 所 解决 的 问题 都 给 出 了 复杂 度 上 限 。 例 如 ， 在 提出 
Strassen 矩阵 乘法 ( 例 18-3 ) 之 前 ， 和 矩阵 乘法 的 复杂 度 上 限 为 妈 ， 因 为 程序 2-22 的 复杂 度 已 
知 为 9(m*)。Strassen 算法 使 矩阵 乘法 的 复杂 度 上 限 降 为 m1。 

f(n) 是 一 个 问题 的 复杂 度 下 限 (lower bound)， 当 且 仅 当 对 该 问题 的 每 一 个 算法 ， 其 复杂 
度 均 为 Q(f(n))。 为 使 一 个 问题 的 复杂 度 下 限 g(n) 成 立 ， 必 须 证 明 对 该 问题 的 每 一 个 算法 ， 其 
复杂 度 均 为 2(g(n))。 这 不 是 一 件 容 易 的 事情 ， 因 为 要 考察 对 该 问题 的 所 有 可 能 的 算法 ， 而 不 
仅 是 一 个 算法 。 

对 很 多 问题 ， 可 以 基于 输入 和 /或 输出 的 数量 ， 建 立 简单 的 复杂 度 下 限 。 例 如 ， 对 7 个 
元 素 的 每 一 个 排序 算法 都 具有 复杂 度 Q(n)， 因 为 每 一 个 排序 算法 对 每 一 个 元 素 都 至 少 检查 一 
次 ， 否则， 未 检查 的 元 素 就 可 能 出 现在 错误 的 位 置 上 。 类 似 的 ， 计 算 两 个 nxn 矩阵 乘积 的 
每 一 个 算法 都 有 复杂 度 Q(n)， 因 为 结果 和 矩阵 有 rw 个 元 素 ， 每 个 元 素 的 生成 所 需要 的 时 间 为 
Q2(1)。 只 有 非常 有 限 的 问题 具有 精确 的 复杂 度 下 限 。 

在 本 节 中 ， 我 们 将 对 本 章 所 研究 的 两 个 分 而 治之 问题 建立 精确 的 复杂 度 下限 。 这 两 
个 问题 是 n 个 元 素 的 最 小 最 大 问题 和 排序 问题 。 对 这 两 个 问题 ， 我 们 仅 限于 考察 比较 算法 
(comparison algorithm)。 所 谓 比 较 算 法 是 指 仅 包 含 元 素 比较 和 移动 的 算法 。 第 2 章 所 介绍 的 
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最 小 最 大 算法 以 及 本 章 中 所 介绍 的 算法 都 属于 比较 算法 。 除 箱子 排序 和 基数 排序 ( 6.5.1 节 和 
6.5.2 节 )， 本 书 所 介绍 的 其 他 所 有 排序 算法 也 都 是 比较 算法 。 


18.4.1 最 小 最 大 问题 的 下 限 


程序 18-1 是 用 分 而 治之 也 数 求解 n 个 元 素 的 最 小 最 大 问题 的 函数 。 该 函数 执行 了 
[3w21-2 次 比较 。 我 们 将 要 证 明 对 于 该 问题 的 每 一 个 比较 算法 ， 都 至 少 需要 [3mw21-2 次 比 
较 。 为 了 证 明 这 个 结论 ,我们 假设 个 元 素 互 不 相同 。 这 个 假设 不 影响 证 明 的 一 般 性 ， 因 为 
不 同 的 元 素 构成 输入 空间 的 子 集 。 另 外 ， 每 一 个 最 小 最 大 算法 ， 既 要 在 输入 元 素 有 相同 的 时 
候 正 确 ， 又 要 在 输入 元 素 不 同 的 时 候 正 确 。 

在 证 明 过 程 中 ， 我们 使 用 状态 空间 方法 (state space method)。 使 用 这 种 方法 首先 要 描述 算 
法 的 起 始 状态 、 中 间 状 态 和 完成 状态 ， 以 及 从 一 个 状态 到 另 一 个 状态 的 转变 方式 ， 然 后 确定 从 
起 始 状 态 到 完成 状态 所 需 的 最 少 转换 次 数 。 这 个 最 少 转换 次 数 就 是 问题 复杂 度 的 下 限 。 一 个 算 
法 的 起 始 状 态 、 中 间 状 态 和 完成 状态 是 抽象 的 概念 ， 不 要 用 这 种 状态 明确 地 表示 一 个 算法 。 

对 于 最 小 最 大 问题 ， 我 们 可 以 用 元 组 (a,b,c,q) 来 描述 算法 的 状态 ， 其 中 a 表示 最 大 和 最 
小 候选 者 的 元 素 个 数 ，b 表示 不 再 作为 最 小 候选 者 但 仍 可 作为 最 大 候选 者 的 元 素 个 数 ，c 是 不 
再 作为 最 大 候选 者 但 仍 作为 最 小 候选 者 的 元 素 个 数 ，q 是 已 被 确定 为 既 非 最 大 也 非 最 小 候选 
者 的 元 素 个 数 。 令 4、B、C、D 依次 分 别 代 表 上 述 各 种 元 素 的 集合 。 

在 最 小 最 大 算法 开始 时 ， 所 有 nn 个 元素 都 是 最 大 和 最 小 候选 者 ， 因 此 起 始 状 态 为 
(n,0,0,0)。 当 算法 结束 时 ，4 为 空 ，B 和 C 各 有 1 个 元 素 , DD 有 n-2 个 元 素 ， 因 此 完成 状态 为 
(0,1,1,n-2)。 在 元 素 比 较 的 过 程 中 ,算法 从 一 个 状态 向 男 一 个 状态 转变 。 当 4 的 两 个 元 素 比较 
之 后 ， 较 小 的 元 素 进 入 C， 较 大 的 元 素 进入 B。 这 便 是 一 种 可 能 的 状态 转变 : 

(a,b,c,d) — (a-2,b+l1,c+1,d) 
其 他 可 能 的 状态 转变 如 下 。 
e 当 8B 的 两 个 元 素 比 较 之 后 ， 可 能 的 状态 转变 是 : 
(a,b,c,d) — (a,b—l1,c,d+1) 
e 当 C 的 两 个 元 素 比较 之 后 ， 可 能 的 状态 转变 换 是 : 
(a,b,c,d) 一 (a,b,c-1,d+1) 

e 当 4 的 一 个 元 素 与 8 的 一 个 元 素 比较 之 后 ， 可 能 的 状态 转变 是 : 
(a,b,c,d) 一 (a-1,b,c,d+1) (4 的 元 素 大 于 B 的 元 素 ) 
(a,b,c,d) 一 (qa-1,b,c+1,d) (4 的 元 素 小 于 B 的 元 素 ) 

当 4 的 一 个 元 素 与 C 的 一 个 元 素 比 较 之 后 ， 可 能 的 状态 转变 是 : 
(a,b,c,d) 一 (a-1,b,c,d+1) (4 的 元 素 小 于 C 的 元 素 ) 
(a,b,c,d) 一 (a-1,b+1,c,4) (4 的 元 素 大 于 C 的 元 素 ) 

虽然 还 可 能 有 其 他 比较 操作 ， 但 不 能 确定 会 发 生 状 态 转变 。 考 察 上 述 可 能 的 状态 转变 ， 
可 以 发 现 ， 当 nn 为 偶数 时 ， 欲 从 起 始 状 态 (n,0,0,0) 到 达 完 成 状态 (0,1,1,n-2)， 最 快 的 途径 
是 在 4 中 比较 次 数 为 nx/2， 在 8B 中 比较 次 数 为 a/2-1， 在 C 中 比较 次 数 为 n/2-1， 总 共 比 较 
次 数 为 3n/2-2 ; 当 为 奇数 时 ， 最 快 的 方式 是 在 4 中 比较 次 数 为 [m2|， 在 B 中 比较 次 数 为 
ln/21-1， 在 C 中 比较 次 数 为 [|n/2|-1， 在 4 中 剩余 元 素 中 最 多 还 要 比较 两 次 ， 总 共 比 较 次 数 
为 [3n/21-2。 








每 一 个 最 小 最 大 问题 的 比较 算法 ， 从 起 始 状 态 到 完成 状态 的 转变 所 需要 的 比较 次 数 不 会 
少 于 [3n/2]-2， 因 此 [3m/21-2 是 这 类 算法 所 需 比 较 次 数 的 下 限 。 由 此 可 知 ， 程 序 18-1 是 解决 
最 小 最 大 问题 的 理想 的 比较 算法 。 


18.4.2 排序 算法 的 下 限 


使 用 状态 空间 方法 可 以 确定 ， 对 个 元 素 排序 的 比较 算法 ， 在 最 坏 情 况 下 的 复杂 度 下 限 
为 nlogn。 这 一 次 ,我 们 把 n 个 元 素 的 所 有 排列 组 合 的 个 数 指定 为 算法 的 起 始 状 态 。 当 然 ， 我 
们 还 是 假设 这 个 元 素 互 不 相同 。 算 法 开始 时 ，n 个 元 素 的 每 一 个 排列 都 可 能 是 有 序 排列 的 
候选 者 ， 因 此 候选 者 的 个 数 为 n!。 算 法 结束 时 ， 只 剩 下 一 种 排列 。 

当 两 个 元 素 w 与 aj 比较 时 ， 当 前 候选 的 排列 集合 被 分 为 两 组 : 一 组 满足 w<aj ; 另 一 组 
满足 aj>a;。 因 为 已 假设 元 素 互 不 相同 ， 所 以 不 存在 aj=aj 的 情况 。 例 如 ， 假设 n=3， 而 且 首 
先 比 较 al 与 a;。 在 比较 前 ， 所 有 6 种 排列 都 是 有 序 排列 的 候选 者 。 若 ai<as， 则 删除 (aa, a， 
Ga) 、(ai gq, a1) 和 (az, a3, a1), 其 余 3 种 排列 仍 是 候选 者 。 

如 果 当 前 候选 集 有 m 种 排列 ， 那 么 一 次 比较 之 后 分 成 两 组 ， 其 中 一 组 至 少 包含 [m/2] 种 
排列 。 在 最 坏 情 况 下 ， 排 序 算法 的 候选 集 的 大 小 初始 时 为 n!， 一 次 比较 后 降 为 至 少 n!/2， 青 
一 次 比较 后 降 为 至 少 nl/4， 如 此 继续 ， 直 到 为 1。 比 较 次 数 最 少 为 [logn!|。 

因为 n! 三 [mn/21”*m'， 所 以 logn! = (n/2-1)log(n/2)=Q(nlogn)。 因 此 每 种 排序 算法 ( 同时 
也 是 比较 算法 ) 在 最 坏 情况 下 要 进行 2(nlogn) 次 比较 。 

我 们 可 以 用 决策 树 (decision-tree) 来 证 明 而 得 到 同样 的 结果 。 我 们 用 树 来 模拟 算法 的 
进程 。 在 树 的 每 个 内 部 节点 ， 算 法 执行 一 次 比较 ， 并 根据 比较 结果 移 向 它 的 某 一 孩子 。 算 
法 在 外 部 节点 处 终止 。 图 18-20 给 出 了 对 三 元 素 序 列 a[0:2] 使 用 函数 insertionSort( 见 程 
序 2-15) 排序 时 的 决策 树 。 每 个 内 部 节点 有 一 个 形 如 区 的 标识 ， 表 示 a[i] 与 anj] 进行 比较 。 
如 果 af[i]<a[]， 算 法 移 向 左 孩子 ; 如果 afil]>a0j]， 算 法 移 向 右 孩子 。 因 为 元 素 互 不 相同 ， 所 
以 不 会 发 生 a[i]=a[j] 的 情况 。 外 部 节点 表示 有 序 排列 。 在 图 18-20 中 ， 最 左面 的 路 径 代 表 : 
a[1]<a[0] ，a[2]<a[0]，a[2]<a[1]; 因此 最 左 外 节点 为 (a[2],a[1],a[0] )。 








图 18-20 ”函数 insertionSort 在 n=3 时 的 决策 树 


注意 ， 在 排序 算法 的 决策 树 中 ， 每 一 外 部 节点 表示 一 种 唯一 的 输出 排列 。 对 n 个 元 素 的 
一 个 正确 的 排序 算法 一 定 能 产生 n! 种 可 能 的 排列 ， 因 此 其 决策 树 至 少 有 nl! 个 外 部 节点 。 因 
为 一 个 高 度 为 户 的 二 又 树 至 多 有 2" 个 叶 节 点 ， 所 以 排序 算法 的 决策 树 的 高 度 至 少 为 [log,n!]= 
Q(nlogn)。 因 而 ， 每 一 个 排序 算法 在 最 坏 情况 下 至 少 要 进行 2(nlogn) 次 比较 。 另 外 ， 由 于 每 
一 个 具有 nl 个 外 部 节点 的 二 又 树 的 平均 高 度 为 2(nlogn) ( 见 练习 47 )， 所 以 每 个 排序 算法 的 
平均 复杂 度 也 是 Q(nlogn)。 
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由 前 面 的 下 限 证 明 可 知 ， 堆 排序 和 归并 排序 在 最 坏 情况 下 的 性 能 最 优 ( 就 渐 近 复杂 度 而 
言 )， 而 堆 排序 、 归 并 排序 和 快速 排序 在 平均 情况 下 的 性 能 最 优 。 


练习 


42. 用 状态 空间 方法 证 明 ， 求 n 个 元 素 的 最 大 者 ,每 一 种 比较 算法 都 至 少 要 比较 n-1 次 。 

43. 证 明 n! 宇 [n/21”*m!。 

44. 画 出 insertionSort 在 n=4 时 的 决策 树 。 

45. 画 出 mergeSort ( 程序 18-3 ) 在 n=4 时 的 决策 树 。 

46. 今 abh…an 为 n 个 元 素 的 一 个 序列 。 元 素 w 和 aj 是 颠倒 的 (inverted)， 当 上 且 仅 当 aj>aj(i<j)。 
在 元 素 序列 中 ， 具 有 颠倒 关系 的 元 素 对 (asaj) 个 数 被 称 为 颠倒 数 ( inversion number )。 

1 ) 序列 6,2,3,1 的 颠倒 数 是 多 少 ? 

2 ) 在 一 个 地 个 元 素 的 序列 中 ， 最 大 的 颠倒 数 是 多 少 ? 

3 ) 假设 一 种 排序 算法 只 对 相 邻 的 元 素 进 行 比较 并 在 需要 时 进行 交换 ( 实质 上 ， 冒 泡 排 序 、 
选择 排序 和 插入 排序 就 是 这 种 算法 )。 证 明 这 种 排序 算法 在 最 坏 情况 下 必须 执行 20m 
次 比较 。 

47. 令 T 表 示 有 具有 个 内 部 节点 的 扩展 二 叉 树 ; 令 7 表 示 了 的 内 部 路 径 长 度 一 一 从 根 到 每 一 个 
内 部 节点 的 路 径 长 度 之 和 ; 令 巨 表示 了 的 外 部 路 径 长 度 一 一 从 根 到 每 一 个 外 部 节点 的 路 径 
长 度 之 和 。 

1 ) 证 明 E=1+2n。 

2 ) 证 明 ， 当 了 是 完全 二 又 树 时 ，7Z 值 最 小 。 

3 ) 证 明 ， 当 7 了 是 完全 二 叉 树 时 ， 三 (n+1)p-2”"”"+2， 其 中 p= [logs(n+1)]。 

4) 使 用 1)、2) 和 3 ) 的 结果 确定 的 最 小 值 。 

5) 由 4) 的 结果 可 以 证 明 ， 具 有 nn 个 内 部 节点 的 二 叉 树 ， 其 平均 外 部 路 径 长 度 为 
Q(nlogn)。 
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动态 规划 





概述 


在 本 书 研究 的 5 种 设计 方法 中 ， 可 以 说 ， 动 态 规划 是 难度 最 大 的 一 种 。 它 的 基础 是 最 优 
原理 。 有 很 多 问题 ， 用 贪 焚 法 或 分 而 治之 法 无 法 简洁 而 高 效 的 解决 ， 但 是 用 动态 规划 法 就 可 
以 。 本 章 在 介绍 动态 规划 之 后 ， 分 别 考察 它 的 应 用 问题 : 背包 、 和 矩阵 乘法 链 、 最 短路 径 、 无 
交叉 子 集 。 在 本 书 网 站 上 还 另外 介绍 了 一 些 动态 规划 的 应 用 问题 ， 如 图 像 压 缩 和 元 件 折 琶 。 
为 了 掌握 动态 规划 法 ， 应 该 研究 这 些 应 用 问题 ， 而 且 完 成 相应 的 练习 。 


19.1 算法 思想 


动态 规划 和 贪 焚 法 一 样 ， 对 一 个 问题 的 解 是 一 系列 抉择 的 结果 。 在 贪 焚 法 中 ， 我 们 依据 
贪 禁 准 则 做 出 的 每 一 个 抉择 都 是 不 可 撤回 的 。 而 在 动态 规划 中 ,我们 要 考察 一 系列 抉择 ， 以 
确定 一 个 最 优 抉 择 序列 是 否 包含 最 优 抉择 子 序 列 。 下 面 用 一 些 例子 来 说 明 这 一 思想 。 

例 19-1[ 最 短路 径 ] 考察 图 17-2 的 有 向 图 。 假设 要 选择 一 条 从 源 顶 点 s=1 到 目的 项 点 
d=5 的 最 短路 径 ， 我 们 需要 选择 该 路 径 所 经 过 的 顶点 。 第 一 步 可 以 选择 的 顶点 为 2、3 或 4。 
也 就 是 说 ， 从 顶点 1 可 以 移动 到 这 三 个 项 点 中 的 任何 一 个 项 点。 假设 我 们 选择 了 顶点 3。 然 
后 我 们 要 决定 如 何 从 顶点 3 移 到 顶点 5。 如 果 我 们 选择 了 一 条 从 顶点 3 到 顶点 5 的 路 径 ， 但 
不 是 最 短 的 ， 那 么 即使 前 面 我 们 选择 的 从 1 到 3 的 路 径 是 最 短 的 ， 可 是 连 起 来 所 构成 的 从 1 
到 5 的 路 径 也 不 是 最 短 的 。 例 如 ， 若 选择 的 子路 径 是 3,2,5， 其 长 度 为 9， 则 连 起 来 的 路 径 为 
1,3,2,5， 其 长 度 为 11。 如 果 用 最 短 子 路 径 3,4,5 代替 3,2,5， 那 么 路 径 1,3,4,5 的 长 度 为 7 ( 原 
书 为 9， 有 误 。 译 者 注 )。 

在 上 述 最 短路 径 中 ， 如 果 第 一 次 选择 的 是 某 个 顶点 v， 那么 接 下 来 所 选择 的 从 v 到 4 的 
路 径 必须 是 最 短 的 。 面 

例 19-2[0/1 背包 问题 ] 考察 17.3.2 节 的 0/1 背包 问题 。 如 前 所 述 ， 在 该 问题 中 ， 我 们 需 
要 选择 x1…,x; 的 值 。 假 定 我 们 按 物品 =1,2,…,n 的 顺序 选择 x; 的 值 。 如 果 选 择 xi=0， 那 么 背 
包 问 题 就 转变 为 物品 为 2,3,…,n， 背 包容 量 仍 为 c 的 问题 。 如 果 选 择 x1=1， 那 么 背包 问题 就 转 
变 为 物品 为 2,3,…,n， 背 包容 量 为 c-w'i 的 问题 。 令 rE {c,c-wi} 表示 剩余 的 背包 容量 。 

在 第 一 次 选择 之 后 ， 我 们 要 考虑 的 问题 就 是 用 剩余 的 物品 装载 容量 为 的 背包 。 剩 余 的 
物品 ( 即 2 至 n) 和 容量 + 规定 了 在 第 一 次 选择 之 后 的 问题 状态 (problem state )。 不 管 x1 是 0 
还 是 1 ，[x2,…wxa] 必须 是 这 个 问题 状态 的 一 个 最 优 解 。 如 果 不 是 ， 那 么 必 有 一 个 更 好 的 选择 ， 
假设 为 [y3…,y]。 于 是 [Xx1,y2,…,》] 便 是 初始 问题 的 一 个 更 好 的 解 。 

假设 n=3, w=[100,14,10], p=[20,18,15], c=116。 如 果 选 择 xi=1， 那 么 选择 之 后 的 剩余 物品 
是 2 和 3， 剩 余 容 量 上 =116-100=16。 这 个 问题 状态 下 的 一 个 可 行 解 为 [x2,x3]=[0,1]， 价 值 为 
15。 而 [xzx3]=[1,0] 也 是 一 个 可 行 解 ， 价 值 为 18。 因 此 ，[x2,x3]=[0，1] 并 非 最 优 解 。 于 是 ， 
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初始 问题 的 解 x=[1,0,1] 可 改进 为 x=[1,1,0]。 如 果 选 择 x1/=0， 那 么 选择 之 后 的 剩余 物品 是 2 和 
3， 简 余 容量 r=116。 总 之 ， 如 果 在 第 一 次 选择 之 后 的 问题 状态 中 ，[x2,x3] 不 是 最 优 解 ， 那 么 
[x1,x2,X3] 也 不 是 初始 问题 的 最 优 解 。 国 

例 19-3[ 航 费 ] 某 航 线 价格 表 为 : 从 亚特兰大 到 纽约 或 芝加哥 ,或 从 洛杉矶 到 亚特兰大 ， 
票 价 为 $100 ; 从 芝加哥 到 纽约 ， 票 价 为 $20。 对 于 途径 亚特兰大 的 旅客 ， 从 亚特兰大 到 世 加 
哥 ， 票 价 仅 为 $820。 要 从 洛杉矶 到 纽约 ,为 了 省 钱 ， 需 要 选择 中 转机 场 。 如 果 用 (起 点 ， 终 
点 ) 表示 问题 状态 那么 在 选择 从 洛杉矶 到 亚特兰大 后 ， 问 题 状态 变 为 ( 亚特兰大 ， 纽 约 )。 
从 亚特兰大 直达 纽约 的 票 价 为 $100， 所 以 从 洛杉矶 到 纽约 机 票 为 $8200。 而 从 亚特兰大 途径 芝 
加 哥 再 到 纽约 的 票 价 为 $40。 因 此 洛杉矶 一 亚特兰大 一 艺 加 哥 一 纽约 的 总 票 价 为 $140。 

如 果 用 三 元 组 ( tag， 起 点 ,终点 ) 表示 问题 状态 ， 其 中 tag 为 0 表示 转 飞 ，tag 为 1 表示 
其 他 情形 ， 那 么 在 到 达 亚 特 兰 大 后 ， 问 题 状 态 变 为 (0， 亚 特 兰 大， 纽约 )， 它 的 最 优 路 径 是 
以 芝加哥 为 中 转机 场 。 图 

当 最 优 抉择 包含 最 优 抉择 子 序列 时 ， 可 建立 动态 规划 递归 方程 ( dynamic-programming 
recurrence equation )， 它 可 以 帮助 我 们 高 效 地 解决 问题 。 

例 19-4[0/1 背包 ] 在 例 19-2 的 0/1 背包 问题 中 ， 最 优选 择 序列 由 最 优选 择 子 序列 构成 。 
假设 f(i,y) 表示 剩余 容量 为 y， 剩 余 物 品 为 i,it1…,n 的 背包 问题 的 最 优 解 的 值 ， 即 


-IP pW 
Amy) = 6 (19-1) 
和 
,max{fli+tl yfitl,y-w)+p} y>w 
en We (19-2 ) 


根据 最 优 序 列 由 最 优 子 序列 构成 的 结论 ， 可 得 到 了 的 递归 式 。f(1,c) 是 初始 时 背包 问题 最 优 解 
的 值 。 可 使 用 公式 ( 19-2 ) 通过 递归 或 迭代 来 求解 (1,c)。 从 ftn,*) 开始 迭 式 ,ftn,*) 由 公式 ( 19-1 ) 
得 出 ， 然 后 由 公式 ( 19-2 ) 递归 计算 fli*)(i=n-1,n-2,…,2)， 最 后 由 公式 ( 19-2 ) 得 出 fl1,c)。 

对 于 例 19-2, 车 0 y<10， 则 (3,y)=0 ; 车 y 三 10， (3, 攻 =15。 利 用 递归 公式 ( 19-2 ), 可 
得 f(2,y)=0(0 < y<10) ; f(2,y)=15 (10 < y<14) ; f(2,»)=18 (14 < y<24) 和 f(2,»)=33 (y = 24), 
因此 最 优 解 f(1,116)=max {f(2,116), f(2,116-wi)+tpi}=max{f (2,116), f(2,16)+20}=max{33,38}=38。 

现在 计算 x; 值 ， 步 又 如 下 : 若 f(1,c)=f(2,c)， 则 x1=0， 因 为 我 们 可 以 用 容量 c 装载 物品 
2,…,n， 而 得 到 (1,c) 的 值 。 如 果 f(1,c) 对 f(2,c)， 则 x1=1。 接 下 来 需 从 剩余 容量 c-w, 中 寻求 
最 优 解 ， 用 f(2,c-w'i) 表示 。 依 此 类 推 ， 可 得 到 所 有 的 xi(i=1,…,n) 值 。 

在 该 例 中 ， 因 为 f(2,116)=33 关 f(1,116)， 所 以 x1=1。 接 着 利用 返回 值 38-p1=18 和 最 大 
容量 116-w1=16 来 确定 x 及 x3。 注 意 , f(2,16)=18。 因 为 f(3,16)=15 关 f(2,16)， 所 以 x2=1， 
剩余 容量 为 16-w2=2。 因 为 f(3,2)=0， 所 以 x3=0。 男 

无 论 第 一 次 的 选择 是 什么 ， 接 下 来 的 选择 一 定 是 当前 状态 下 的 最 优选 择 ， 我 们 称 此 为 最 
优 原 则 ( principle of optimality )。 它 意味 着 一 个 最 优选 择 序列 是 由 最 优选 择 子 序列 构成 的 。 但 
是 ， 最 优 原则 可 能 对 某 些 问题 的 求解 并 不 适用 ， 这 时 就 不 能 应 用 动态 规划 。 

应 用 动态 规划 求解 的 步骤 如 下 : 

1 ) 证 实 最 优 原 则 是 适用 的 。 

2 ) 建立 动态 规划 的 递归 方程 式 。 

3 ) 求解 动态 规划 的 递归 方程 式 以 获得 最 优 解 。 
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) 沿 着 最 优 解 的 生成 过 程 进行 回溯 ( traceback ). 
编写 一 个 简单 的 递归 程序 来 求解 动态 规划 递归 方程 是 一 件 很 诱 人 的 事 。 然 而 ， 我 们 将 在 
下 文 看 到 ， 如 果 不 能 避免 重复 计算 ,递归 程序 的 复杂 度 将 非常 可 观 。 如 果 人 避免 了 重复 计算 ， 
复杂 度 将 急剧 下 降 。 动 态 规 划 递 归 方 程 也 可 用 和 迭代 方式 来 求解 ， 这 时 就 自然 避免 了 重复 计算 。 
其 实 ， 壕 代 程 序 与 避免 了 重复 计算 的 递归 程序 有 相同 的 复杂 度 ， 但 是 迭代 程序 不 需要 附加 的 
递归 栈 空间 ， 因 此 将 比 后 者 运行 更 快 。 


19.2 应 用 
19.2.1 ”0/1 背包 问题 

1. 递归 求解 

在 例 19-4 中 已 建立 了 背包 问题 的 动态 规划 递归 公式 ( 19-2 )。 求 解 这 个 递归 公式 的 一 个 
很 自然 的 方法 便 是 程序 19-1 的 递归 函数 ， 返 回 值 是 f(1,c) 的 值 。 它 利用 了 全 局 变量 profit、 


weight 和 和 numberOfObjects。 物 品 的 价值 和 重量 分 别 用 profit[1: numberOfObjects] 和 weight[1: 
numberOfObjects] 来 表示 。 


程序 19-1 ”背包 问题 的 递归 函数 


int f (int i,int theCapacity) 
{1/ 返回 (i，theCapacity) 的 值 
if (i == numberOfobjects) 
return(theCapacity < weight [numberofObjects] 
? 0:Profit [numberOfObjects]); 
if (theCapacity<weight{[i]) 
return f (i+l,theCapacity); 
return max (上 (i+l,theCapacity), 
f (i+1,theCapacity-weight[i])+profit[i]); 
} 


令 t(n) 是 程序 19-1 解决 n 件 物品 背包 问题 时 所 需要 的 时 间 。4(1)=aj;t(n) < 2i(n-1)+b,(n>1)， 
其 中 wa、2 为 常数 。 通 过 递归 求解 得 到 1(n)=O(2” )。 

例 19-5 ”假定 n=5, p=[6,3,5,4,6]，w=[2,2,6,5,4] 且 c=10。 为 了 求 f(1,10) 的 值 ， 用 f(1,10) 
调用 递归 函数 /， 其 返回 值 便 是 了 (1,10) 的 值 。 递 归 调 用 的 关系 如 图 19-1 的 树 形 结构 所 示 。 其 
中 每 个 节点 用 y 值 来 标识 。 对 第 j 层 的 节点 有 i=j。 因 此 根 节点 表示 J(1,10)， 而 它 有 左 孩 子 
和 右 孩 子 ， 分 别 表示 /2,10) 和 f(2,8)。 总 共 执 行 27 次 递归 调用 。 其 中 含有 重复 计算 。 例 如 ， 
3.8) 计算 两 次 ， 相 同情 况 的 还 有 (4,8)、f(4,2)、f(5,8)、f(5,3) 和 7(5,2)。 如 果 保 留 以 前 的 调 
用 结果 ， 那 么 就 可 以 省 去 用 阴影 表示 的 节点 ， 从 而 将 调用 次 数 减 至 21。 


B® © A 


图 19-1 递归 调用 树 图 
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2. 无 重复 计算 的 递归 求解 

正如 在 例 19-5 中 所 看 到 的 那样 ， 程 序 19-1 做 了 一 些 重复 计算 。 为 了 避免 对 (i,y) 的 重复 
计算 ,可 以 建立 一 个 列表 ， 把 计算 过 的 f(i,y) 的 值 保留 在 这 个 列表 中 。 该 列表 的 元 素 是 一 个 三 
元 组 (i,y,f(i,y)))。 在 调用 fli,y) 之 前 ， 检 查 该 列表 ， 如 果 已 经 存在 一 个 三 元 组 (i,y,*) ( 其 中 * 表 
示 通 配 符 )， 那 就 取出 (i,y) 的 值 ， 否 则 ， 调 用 f(i,y)， 然 后 把 得 到 的 三 元 组 (i,y,f(i,y)) 加 入 列 
表 中 。 该 列表 既 可 以 用 散 列 表 ( 见 10.5 节 ) 来 表示 ， 也 可 用 二 又 搜索 树 ( 见 15 章 ) 来 表示 。 

如 果 权 为 整数 ， 那 么 可 以 用 整 型 数组 fArray[i][y] 表示 上 述 的 列表 。fArray[i][y] 等 于 -1， 
当 且 仅 当 J(i,y) 还 没有 计算 。 程 序 19-2 是 避免 了 重复 计算 的 递归 代码 ， 它 令 fArray 为 (n+1) x 
(c+1) 为 全 局 整 型 数组 ， 初 始 值 为 -1。 

为 了 确定 程序 19-2 的 时 间 复 杂 度 ， 我 们 使 用 一 种 记 账 式 算法 ， 把 总 时 间 的 不 同 构成 部 
分 都 分 别 计算 在 f(i,y) 上 ， 然 后 累加 。 当 计算 (i,y) 时 ， 如 果 f(i+1,z) 还 没有 计算 ， 就 把 调用 
f(it1,z) 的 时 间 记 在 f(it1,z) 上 ， 否 则 就 记 在 (i,z) 上 (J(it1,z) 反 过 来 把 计算 新 的 了 (*,*) 的 时 
间 记 在 个 别 要 计算 的 了 (*,*) 的 时 间 上 )。 程 序 19-2 剩余 部 分 所 需要 的 时 间 记 在 /7) 上 ， 复杂 
度 为 9(1)。f(i,y) 的 总 值 是 一 个 常量 ,f(i,y) 的 个 数 是 (c+1)(n+1)。 所 以 总 时 间 为 O(cn) (c 表 
示 背 包容 量 , 表示 物品 个 数 )。 通 过 避免 fl(i,y) 的 重复 计算 ， 可 以 把 递归 函数 的 运行 时 间 从 
不 切实 际 的 O(n?) 降 为 切实 可 行 的 O(cn)。 





程序 19-2 ”无 重复 计算 的 背包 问题 递归 函数 
int £ (int i,int theCapacity) 
{// 返回 f (i,theCapacity)。 不 重复 计算 f£ 的 值 
1/ 检查 是 否 已 经 计算 过 
if (fArray[li] [theCapacity]>=0) 
return fArray[i] [theCapacity]; 





/还 没有 计算 过 
if (i==numberOfObjects) 
{1/ 使 用 公式 (19-1 ) 
// 计算 并 存储 E (i, theCapacity) 
fArray[i] [theCapacity]=(theCapacity<weight [numberOfObjects] 
? 0:profit[numberOfObjects]); 
return fArray[li][theCapacity]; 
} 
1/ 使 用 公式 (19-2) 
if (theCapacity<weight[i]) 
1/ 物品 i 不 适合 
fArray[i] [theCapacity]=f (i+1,theCapacity); 
else 
1/ 物品 i 适合， 尝试 两 种 可 能 
fArrayli] [theCapacity]=max (f (i+1, theCapacity), 
£f (i+l,theCapacity-weight[i])+profit[i]); 
return fArray[i] [theCapacity]; 
} 





3. 权 为 整数 的 近代 求解 

当权 为 整数 时 ,我 们 可 以 设计 一 个 相当 简单 的 迭代 程序 (程序 19-3 ) 来 求解 /(1,c)。 该 
算法 基于 例 19-4 的 策略 ， 每 个 f(i,y) 只 计算 一 次 。 程 序 19-3 用 二 维 数组 |[] 来 保存 f 的 值 。 
程序 19-4 的 函数 traceback 用 回 浏 法 确定 最 优 解 x; 的 值 。 
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程序 19-3 ”用 迭代 算法 计算 f 


void knapsack (int *profit, int *weight, int numberOfObjects, 
int knapsackCapacity, int **f£) 

{1/ 用 迭代 算法 求解 动态 规划 的 递归 方程 

/ 计算 上 [I] [knapsackCapacity] 和 f[i][y] 

/2 <= i <= numberOfObjects, 0 <= y <= knapsackCapacity 

/profit[l:numberOofobjects] 给 出 物品 的 价值 

H/ weight[1:numberOfobjects] 给 出 物品 的 重量 


1// 初始 化 ELnumberofobjectsj[] 

int yMax = min(weight [numberotobjectsl - 1, knapsackCapacity}); 

for (int y = 0; y <= yMax; y++) 
flnumberOfObjects][y] = 0; 

for (int y = weightinumberOfObjects]; y <= knapsackCapacity; y++) 
finumberOfObjects] [y] = profit[lnumberOfObjects]; 

NW 计算 EE] [六 Y's 1< i < numberofobjects 

for (int i = numberOfObjects - 1; i > 1; i-—-) 

{ 


yMax = minl(weight[i] - 1, knapsackCapacity); 
for (int y = 0; y <= yMax; y++) 
吾 峙 站 7] fli + 1][Y¥] 
for (int y = weight[il]; y <= knapsackCapacity; y++) 
Et] CY] max (EE[E 步 1] [Yj;EIi 二 1][y = weight[&]) + profitli])» 


ll 


ll 


/计算 f[1] [knapsackCapacity] 
f[1] [knapsackCapacity] = f[2] [knapsackCapacity]; 
if (knapsackCapacity >= weight[1]) 
f[1] [knapsackCapacity] = max(f[l1] [knapsackCapacity], 
f[2] [knapsackCapacity-weight[1]] + profit[1]); 


程序 19-4 ”用 和 迭代 算法 计算 x 


void traceback (int **f, int *weight, int numberOfObjects, 
int knapsackCapacity, int *x) 
{W 计算 解 向 量 x 


for (int i = 1; i < numberOfObijects; i++) 


if (£f[i] [knapsackCapacity] == f[i+l] [knapsackCapacity]) 
/不 包括 物品 i 
x[lih = OF 
else 
{/ 包括 物品 
x[i] = 1; 
knapsackCapacity -= weight [i]; 


} 


xinumberofObjects] = (f[numberOfObjects] [knapsackCapacity] > 0) 


守业 区 区 





例 19-6 使 用 例 19-5 的 数据 ， 由 程序 19-3 计算 出 的 数组 了 如 图 19-2 所 示 。 计 算 顺 序 按 
行 从 上 到 下 ， 按 列 从 左 到 右 。 没 有 显示 li][10] = 15。 


我 们 从 x 开始 来 确定 x 的 值 。 因 为 f(1,10) 对 了 (2,10)， 所 以 一 定 有 了 (1,10)=f(2,10-wi)+p1= 
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f(2,8)+6。 因 此 xi=1。 因 为 1(2,8) 关 73,8)， 所 以 一 定 有 ,2.8)=73,8-w2)+p2=7(G3,6)+3。 因 此 


xz=1。 因 为 1(3,6)=f(4,6)=f(5,6)， 所 以 xs=xe=0。 最 后 ， ee 
因为 /(5,4) 产 0， 所 以 xs=1。 ora rrr es 





函数 knapsack 的 复杂 度 为 (ne), 而 traceback 的 |5 人 
3|11010|10101616161616|110111 
复杂 度 为 @(n)。 守重 直 [总 于 当 | 看 | 通 和 转生 呈 小半 1 O04 惠 
4. 元 组 法 (选读 ) 
程序 19-3 有 两 个 缺点 :1 ) 要 求 权 为 整数 ; 2) 当 图 192 全 19-6 的 7 函数 /数组 


背包 容量 很 大 时 ， 它 的 速度 慢 于 程序 19-1。 尤 其 是 ， 若 容量 c>2"， 则 复杂 度 为 8(n2”)。 使 
用 元 组 法 可 以 克服 这 两 个 缺点 。 在 元 组 法 中 ， 对 于 每 个 i，f(i,y) 都 以 数 对 (y,f(i,»)) 的 形式 
按 y 的 递增 次 序 存储 于 表 P(i) 中 。 男 外 ， 因 为 (i,y) 是 y 的 非 递 减 函 数 ， 所 以 PQ) 中 的 数 对 
(y,f(i,y)) 也 是 按 f(i,y) 的 递增 次 序 排列 的 。 

例 19-7 考虑 图 19-2 的 函数 Jf。 当 二 5 时 ，P(5)=[(0,0),(4,6)]， 函数 /完全 由 此 确定 。 当 
i=4,3,2 时 , P(i) 分 别 为 [(0,0), (4,6), (9,10)], [(0,0), (4,6), (9,10), (10,11)], [(0,0), (2,3), (4,6), 
(6,9), (9,10),(10,11)]。 

为 计算 f(1,10)， 由 公式 (19-2) 可 得 ,，f(1,10)=max{f(2,10),f(2,8)+p1}。 由 P(2) 可 得 ， 
f(2,10)=11，f(2,8)=9。 因 此 f(1,10)=max{11,15}=15。 

为 计算 x; 的 值 ， 我 们 从 计算 x 的 值 开 始 。 因 为 f(1,10)=f(2,6)+p1， 所 以 x1=1。 因 为 了 (2， 
6)=f(3,6-w2)+p2=f(3,4)+p2， 所 以 x2=1。 因 为 1(3,4)=f(4,4)=f(5,4)， 所 以 x3=xs=0。 最 后 ， 因 为 
f(5,4) 关 0， 所 以 xs=1。 面 

检查 每 一 个 P(i) 可 以 发 现 ， 其 中 每 一 个 数 对 (y,f(i,y)) 都 与 变量 x;，…，x 的 一 次 0/1 赋 
值 对 应 。 设 (a,8) 和 (c,q) 分 别 与 xi?，…， x 的 两 次 0/1 赋值 对 应 。 如 果 a 三 c 且 5<4， 则 称 
(a,b) 受 (b,c) 支配 。 受 支配 者 不 加 入 P(i)。 若 相同 的 数 对 对 应 两 个 或 更 多 的 赋值 ， 则 一 个 数 对 
加 入 PQ)。 

假设 w 和 c，P(n)=[(0,0),(wwpn)]。 与 x 对 应 的 两 个 数 对 分 别 等 于 0 和 1。 对 每 一 个 i 
可 以 从 P(i+1) 得 到 P(i)。 首 先 计算 数 对 的 有 序 序列 2， 使 得 当 且 仅 当 wi < s < c, 且 (s-wsf- 
户 是 P(i+1) 的 一 个 数 对 时 ，(Gs 力 是 2 的 一 个 数 对 。 现 在 2 包含 xF=1l 的 数 对 ，P(i+1) 包含 
xF0 的 数 对 。 下 一 步 是 合并 2 和 P(i+1)， 并 删除 受 支 配 者 和 重复 数 对 ， 以 得 到 P(i)。 

例 19-8 考察 例 19-7。P(5)=[(0,0),(4,6)]， 因 此 Q=[(5,4),(9,10)]。 当 P(5) 和 QQ 合并 得 到 
P(4) 时 。 数 对 (5,4) 被 删除 ， 因 为 它 受 (4,6) 支配 。 结 果 P(4)=[(0,0),(4,6),(9,10)]。 接 着 计算 P(3)， 
首先 由 P(4) 得 到 2=[(6.5)(10,10)]。 然 后 和 P(4) 合并 得 到 PG3)=[(0.0),(4,6),(9,10),(10,10)]。 最 后 
计算 PC2)， 由 P(3) 得 到 Q=[(2,3)，(6,9)]。P(3) 与 合并 得 到 P(2)=[(0,0)，(2,3)，(4,6)，(6,9)， 
(9,10), (10,11)]。 二 

因为 每 个 POD 中 的 数 对 都 表示 x…,x; 的 一 次 不 同 的 0/1 赋值， 因此 PG) 中 的 数 对 不 
会 超过 2”+! 个 。 在 计算 PO) 时， 计算 8 需 用 时 @(PGi+1)|)。 合 并 Plitl) 和 QO 也 需 用 时 
QO(P(i+1))。 因 此 ， 计 算 所 有 PQ) 所 需要 的 时 间 为 : 0 (SlPpG+ )|)=002"。 当权 为 整数 时 ， 
POD)| < c+1, 这 时 的 复杂 度 为 O(min {nc,2"})。 可 


19.2.2 矩阵 乘法 链 


1. 问题 描述 
mxn 和 矩阵 4 与 nxp 和 矩阵 B 相 乘 需 用 时 @(mnp) ( 见 第 2 章 练习 24 )。 我 们 把 mnp 作为 两 


锚 19 茧 动态 规划 485 


个 矩阵 相 乘 所 需 时 间 的 测量 值 。 假 定 要 计算 三 个 矩阵 4、B8 和 C 的 乘积 。 为 此 有 两 种 计算 方 
式 。 第 一 种 是 (4*B)*C。 第 二 种 是 4*(8*C)。 虽 然 两 种 计算 的 结果 相同 ， 但 时 间 性 能 会 有 很 大 

例 19-9 假定 4 为 100x1 和 矩阵 ,下 为 1x100 和 矩阵 ，C 为 100x1 和 矩阵 。 计 算 4*B 的 时 
间 为 10 000 个 时 间 单 位 ， 中 间 矩 阵 为 100 x 100， 再 与 C 相 乘 所 需 时 间 为 1000 000 个 时间 
单位 。 综合 起 来 ， 计 算 (4*B8)*C 的 总 时 间 为 1 010 000 个 时 间 单 位 。 计 算 B*C 时 间 为 10 000 
个 时 间 单 位 ， 中 间 和 抢 阵 为 1x1， 再 与 4 相 乘 的 时 间 为 100 个 时 间 单 位 ， 因 而 计算 4*(B8*C) 
的 时 间 只 有 10 100 个 时 间 单 位 ! 另外 ， 计 算 (4*8)*C 需 10 000 个 单元 来 存储 4*B， 而 计算 
A*(B*C) 只 需 用 1 个 单元 来 存储 B*C。 

三 维 图 像 的 定位 也 遇 到 和 矩阵 相 乘 的 顺序 问题 。 在 定位 中 ， 我 们 要 确定 一 个 图 像 需 要 
旋转 、 平 移 和 缩放 多 少 次 才能 通 近 另 一 个 图 像 。 实 现 定 位 的 一 个 计算 方法 是 执行 约 100 次 选 
代 。 每 次 迭代 需要 计算 12 x 1 个 向 量 7: 
T = 2》 A(x,y,2)* By,z)*C (x,y,2) 

其 中 4、B 和 C 分 别 为 12x3、3x3 和 3x1 和 矩阵 。(x,y,z) 是 三 维 像 素 的 坐标 。 令 1 表示 一 
三 维 像素 所 需要 计算 的 4(x,y,z)*B(x,y,z)*C(x,y,z) 的 计算 量 。 假 设 图 像 含 有 256 x 256 x 256 
个 三 维 像素 。 这 时 ，100 次 迭代 所 需 的 总 计算 量 近似 为 100*256"*t = 1.7*10?!。 若 三 个 矩阵 由 
左 向 右 相 乘 ， 则 :=12*3*3+12*3*1=144 ; 但 若 由 右 向 左 相 乘 ， 则 {=3*3*1+12*3*1=45。 由 左 至 
右 计算 约 需 2.4*10" 个 操作 ， 而 由 右 至 左 计算 大 概 只 需 7.5*10" 个 操作 。 使 用 一 台 每 秒 可 执 
行 1 亿 次 操作 的 计算 机 ， 由 左 至 右 需 40 分 钟 ， 而 由 右 至 左 只 需 12.5 分 钟 。 画 

在 计算 和 矩阵 乘积 4*B8*C 时 ， 仅 有 两 种 乘法 顺序 ( 由 左 至 右 或 由 右 至 左 )， 因 此 我 们 可 以 
算出 每 种 顺序 所 需要 的 操作 数 ， 然 后 选择 操作 数 比 较 少 的 那 一 种 。 而 在 更 一 般 的 情况 下 ， 我 
们 要 计算 的 矩阵 乘积 是 Mi x M2 x……: x Ah， 其 中 Mi 是 一 个 rixrit! 和 矩阵 (1 < i < gq)。 考 虑 
gq=4 的 情况 ， 此 时 和 矩阵 乘积 4*8*C*D 有 下 列 5 种 计算 顺序 : 

A*((B*C)*D) A*(B*(C*D)) 
(4*B)*(C*D) ((4*B)*C)*D ((A*(B*C))*D 

g 个 矩阵 相 乘 的 方式 随 g 的 增加 而 以 指数 级 增加 。 因 此 ，g 很 大 时 ， 考 虑 每 一 种 乘法 顺序 
并 选择 最 优 者 已 不 切实 际 。 

2. 动态 规划 公式 

我 们 可 以 用 动态 规划 来 确定 一 个 最 优 的 矩阵 乘法 顺序 。 这 种 方法 可 将 算法 的 用 时 降 为 
0(q )。 令 Mij 表示 乘积 链 Mi x…xa (i <j) 的 结果 ，c(i,j) 表示 用 最 优 法 计算 My 时 的 时 
间 消 耗 。 令 kay(i,j) 为 用 最 优 法 计算 Mi 的 最 后 一 步 Mi x May 的 消耗 。 因 此 Mi 的 最 优 算 
法 包括 如 何 用 最 优 算法 计算 Mi 和 Miti,j 以 及 计算 Mi x Mir1.j。 根 据 最 优 原 理 ， 可 得 到 如 下 
的 动态 规划 递归 公式 : 

c(ii)=0, li<gqg 
C(Li+1) = rr Kay(ii+l)=i, 1 < i<g 
c(i,its)= min {c(i, +e(k+lits)trnirm), lg<igg-s,l<s<g 
kay(i,its) = 获得 上 述 最 小 的 大 值 

以 上 求 c 的 递归 式 可 用 递归 或 迭代 的 方法 来 求解 。c(1,9) 为 用 最 优 法 计算 矩阵 乘法 链 的 消 

耗 ，kay(1,9) 为 最 后 一 步 的 消耗 。 其 余 的 乘积 可 由 kay 值 来 确定 。 
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3. 递归 求解 
与 求解 0/1 背包 问题 一 样 ， 本 递归 方法 也 须 避 免 c(i,j) 和 kay(i,j) 的 重复 计算 ， 和 否则 算法 
的 复杂 度 将 会 非常 高 。 
例 19-10 设 g=5 和 x= (10,5,1,10,2,10 )， 由 动态 规划 的 递归 式 得 : 
c(1,5)=min{c(1,1)+c(2,5)+500,c(1,2)+c(3,5)+100,c(1,3)+c(4,5)+1000,c(1,4)+c(5,5)+200} (19-3 ) 
其 中 有 4 个 c 的 s 值 等 于 0 或 等 于 1， 因 此 用 动态 规划 公式 可 立即 求 得 它们 的 值 : c(1,1)=c(5,5)=0; 
c(1,2)=50:c(4,5)=200。c(2,5) 的 计算 如 下 : 
c(2,5)=min{c(2,2)+c(3,5)+50,c(2,3)+c(4,5)+500,c(2,4)+c(5,5)+100} (19-4) 
其 中 c(2,2)=c($,5)=0; c(2,3)=50; c(4,5)=200。 再 计算 c(3,5) 及 c(2,4): 
c(3,5)=min{c(3,3)+c(4,5)+100,c(3,4)+c(5,5)+20}=min{0+200+100,20+0+20}=40 
c(2,4)=min{c(2,2)+c(3,4)+10,c(2,3)+c(4,4)+100}=min{0+20+10,50+0+20}=30 
由 以 上 计算 还 可 得 到 kay(3,5)=4，kay(2,4)=2。 现 在 ， 计算 c(2,5) 所 需要 的 所 有 中 间 值 都 
已 具备 ， 将 这 些 中 间 值 代入 公式 (19-4) 得 到 : 
c(2.5)=min{0+40+50,S0+200+500,30+0+100}=90 
且 kay(2,5)=2。 为 了 用 公式 (19-3) 计算 c(1,5)， 我 们 还 需要 先 计算 c(3,5)、c(1,3) 和 c(1,4)。 按 
照 上 述 过 程 可 计算 出 它们 的 值 分 别 为 40、150 和 90。 相 应 的 kay 值 分 别 为 4、2 和 2。 代 入 公 
式 (19-3) 得 到 : 
c(1,5)=min{0+90+500,50+40+100,150+200+1000,90-+0+200}=190 
且 kay(1,5)=2。 
这 个 矩阵 乘积 的 最 优 算法 耗 时 190 个 时 间 单 位 。 由 kay(1,5)=2 可 推出 该 算法 的 最 后 一 步 
Mis 是 由 Ma x Mis 的 计算 得 到 的 。 因 为 Wi 和 Was 都 是 用 最 优 法 计算 而 来 ， 所 以 用 kay 的 值 
可 以 说 明 它们 是 如 何 计算 的 。 由 kay(1,2)=1 知 ，Mi， 等 于 Mix My»。 同 理由 kay(3,5)=4 得 知 ， 
Mss 由 Ma x Mss 算出 。 依 此 类 推 ，Mas 由 Ma x Ma 得 出 。 于 是 ， 这 个 矩阵 乘积 的 最 优 算 法 步 
又 为 : 
由 AM X Mz 得 到 Mi 
由 M33X Maa 得 到 M3a 
由 M3sX Mss 得 到 Mss 
由 MizX Mas 得 到 Mis 国 


计算 c(i,j) 和 kay(i,j) 的 递归 代码 见 程序 19-5。 其 中 ， 一 维 整 型 数组 x 和 二 维 整 型 数组 
kay 都 是 全 局 变量 。 函 数 c 计算 c(i,j) 的 值 ， 并 且 计 算 kay(a,b) 的 值 ， 同 时 赋 给 kay[a][5]， 即 
kay[a][5]=kay(a,6b)。 晴 数 traceback 利用 函数 c 算 出 的 kay 值 来 推导 出 最 优 乘法 算法 的 步骤 。 

设 t(q) 为 函数 c 的 复杂 度 ， 其 中 g=j-i+1 ( 即 Mij 是 dg 个 矩阵 运算 的 结果 )。 当 9 为 1 或 2 
时 ，t9)=d， 其 中 4 为 一 常数 ; 而 当 gq>2 时 ，z(gq) = aS + eg ， 其 中 e 是 一 个 常量 。 因 此 当 
q>2 时 ，1(q)>21(q-1)+e。 所 以 i(q)=Q(2”)。 也 数 traveback 的 复杂 度 为 0(q)。 


程序 19-5 递归 计算 c(i,j) 和 kay(i,j) 
Lat SG(ine TL, LnE 1} 
{// 返回 c (i, 了 ) 的 值 ， 而 且 用 kay [i][j] 存储 kay (i,j) 的 值 
让 == 了 


return 0; // 一 个 矩阵 
if(i==j- 1) 
{VW 两 个 矩阵 

放学 [于 [二 六 1] 军 于 光 

returmn [lil 3 El 1] [和 主 古 2]3 
} 


1/ 多 于 两 个 矩阵 

1// 设 置 忌 为 k = i 的 最 小 项 

Bat 1 
kayli] [jl = iy 











/ 计算 其 余 的 最 小 项 ， 更 新 u 
for (int k= 4 1; k < J» K++) 
| 





an (1 的 二 1 了 3 
if (t < u) 
{1/ 找到 较 小 项 ， 更 新 u 和 kay[i] [j] 

= 攻关 

kay[i][j] = k; 


} 


return Ur 


} 


void traceback (int i, int j) 
{/ 输出 Mij 的 最 佳 计 算 顺序 

if (1 == 二) 1/ 仅 有 一 个 矩阵 

PEOtWErn 

traceback (i, kay[i][j]); 

traceback (kay [Ll] [ly] + 1353): 

cout << "Multiply M " << < ™ " «< kay[lil[j] << 

由 and 了 x (RayIli] [jl + 1 RY We i << endl; 





4. 无 重复 计算 的 递归 方法 


如 果 避 免 了 < 值 的 (因此 也 是 kay 值 的 ) 重复 ,就 可 将 复杂 度 降低 到 O(q’)。 为 了 避免 重 
复 计算 ,需要 把 c(i,j ) 的 值 存储 到 一 个 全 局 二 维 数组 变量 theC[][] 中 ， 该 数组 的 初始 值 为 0。 


程序 19-6 是 函数 c 的 新 代码 。 
程序 19-6 无 重复 计算 的 c(i,j) 计算 方法 


Tne, C(t E33 ) 
{// 返回 c(i,j 了 ) 的 值 ， 而且 用 kay[i] [j] 存储 kay (i,j) 的 值 
1/ 检查 是 否 已 经 计算 过 
if (theC[i][j] > 0) 1/c(i,i) 已 经 计算 过 
return thec[i][j]; 


1/c (i,j 了 ) 以 前 没有 计算 过 ,现在 开始 计算 


if (i == j) 
return 0; // 一 个 矩阵 
if (i == j - 1) 


{// 两 个 矩阵 
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kay[i][i + 1] = i; 
hec[ij tj [I] [市 于 ElB 二 213 
return thec[li] [j]; 

} 


1/ 多 余 两 个 矩阵 

/设置 上 为 k = i 的 最 小 项 

tt 过 人 杜 半 二 人 估 全 本 秆 天 二] 过 葡 际 十 到 和 呈 于 于 芝 
Ka 二 


// 计算 其 余 的 最 小 项 ， 且 更 新 忆 
Eeor (int k 三 省 于 工 和 kK 人 < 本: 区 + 
{ 
i 它 二 人 


i ( 蕊 < a) 
{W 找到 较 小 项 ,更 新 u 和 kay[i][j] 
训 过 市 六 
kay[li][j] = k; 
} 
} 
theC[il][j] = ui; 


return theC[il][(j]; 
} 


为 了 分 析 改 进 后 的 函数 c ( 见 程序 19-6 ) 的 复杂 度 ， 还 需要 使 用 分 期 计算 方法 。 注 意 
到 调用 c(1.9) 时 每 个 c(i,j) (1 大 is 和 7 三 9) 仅 计 算 一 次 。 对 于 s=j-i>1， 计算 尚 未 计算 过 的 
c(a,b) 需要 附加 的 工作 量 为 s。 将 s 计 入 c(a,b) 第 一 次 计算 时 的 工作 量 中 。 在 计算 c(a,8) 时 ,s 
将 转 计 到 每 个 c(a,b) 的 第 一 次 计算 时 间 c 中 ， 因 此 每 个 c(i,j) 均 需 要 * 个 工作 量 。 对 于 每 个 s， 
有 g-s+1 个 c(ij) 需要 计算 ,因此 总 的 工作 消耗 为 人 s(g -s+1) =0(9”)。 

5. 移 代 求解 

c 的 动态 规划 递归 式 可 用 迭代 的 方法 来 求解 。 若 按 s=2,3,…,q-1 的 顺序 计算 c(i,its)， 每 
个 c 和 kay 仅 需 计算 一 次 。 

例 19-11 考察 例 19-10 中 5 个 矩阵 的 情况 。 先 初始 化 c(i,j) 为 0(1 < i < 5)。 然 后 对 于 
过 1,…,4 分 别 计算 c(i,it1)。c(1,2)=rir2r3=50，c(2,3)=50，c(3,4)=20 和 c(4,5)=200。 相 应 的 kay 
值 分 别 为 1,2,3 和 4。 

当 $= 和 2 时 ， 可 得 : 

c(1,3)=min{c(1,1)+c(2,3)+rir2ra,c(1,2)+c(3,3)+rirara}=min{0+50+500,50+0+100}=150 
且 kay(1,3)=2。 用 相同 方法 可 求 得 c(2,4) 和 c(3,5) 分 别 为 30 和 40， 相 应 的 kay 值 分 别 为 2 
和 3。 

当 s=3 时 ， 需 要 计算 c(1,4) 和 c(2,5)。 计 算 c(2,5) 所 需要 的 所 有 中 间 值 均 已 知 ( 见 公式 
( 19-4 ))。 把 这 些 中 间 值 代入 公式 后 可 得 c(2,5)=90，kay(2,5)=2。c(1,4) 可 用 同样 的 公式 计算 。 
最 后 ， 当 s=4 时 ， 仅 有 c(1,5) 需要 计算 。 使 用 的 是 公式 (19-3 )。 这 时 该 式 右边 的 所 有 项 都 是 
已 知 的 。 园 

计算 c 和 kay 的 选 代 程序 见 函 数 matrixChain ( 见 程序 19-7 )。 该 函数 的 复杂 度 为 O(g3)。 
计算 出 kay 之 后 ， 用 回溯 法 可 以 推算 出 最 优 乘法 计算 过 程 。 
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程序 19-7 c 和 kay 的 和 迭代 计算 
void matrixChain (int q) 
{1/ 用 和 迭代 法 计算 所 有 Mij 的 c 值 和 kay 值 
1/r[] 表示 维 数 的 数组 ; q 是 矩阵 个 数 
Hec 是 时 间 耗 费 和 矩阵 ; kay 是 循环 选择 器 


/初始 化 c[il[il，crilr[Ii+l] 和 kay[i][i+1] 


fe (int i = 1 i < 7 T++) 

{ 
c[li][i] = 0; 
1 [入 二 了 二 高 生效 二 汪 轩 六 二 学 
kay[i][i + 1] = i; 

} 

clgqj[gq] = 0; 


// 计算 余下 的 c 和 kay 


ff (EE 玉 三 27 交 本 9 5S++j) 


fF (int 主导 和 
{1/k = 工时 的 最 小 项 
区 [车] 上 Rj 三 大国 大 各 区 [ 邑 于 让 [下 填写 
eli mtit 1 et 


和 
kay[il][i + s] is; 


1/ 余下 的 最 小 项 
££GrE (Nt 其 二 主 十 站 和 
{ 
4 七 二 CTH] [EK] GfK 二 上 取证 
类 主 &] TL 寺 沁 和 革 下 
4 (人世 党 总 [二 人 二 海 J) 
{W 更 小 的 最 小 项 ， 更 新 c 和 kay 
CT] 1 1 有 


kay[i][i + sl] k; 


19.2.3 所 有 项 点 对 之 间 的 最 短路 径 


1. 问题 描述 

所 有 项 点 对 之 间 的 最 短路 径 问 题 是 指 在 有 问 图 G 中 ， 寻 找 每 一 对 顶点 之 间 的 最 短路 径 。 
即 对 于 每 对 顶点 (i,j)， 要 寻找 从 顶点 i 到 顶点 /以 及 从 顶点 j 到 顶点 i 的 最 短路 径 。 在 无 向 图 
中 ， 这 两 条 路 径 等 于 一 条 。 

当 边 上 的 权 都 不 是 负 值 的 时 候 ， 所 有 顶点 对 之 间 的 最 短路 径 可 以 用 17.3.5 节 的 Dijkstra 
单 源 算法 n 次 来 求解 ， 每 一 次 都 选择 n 个 顶点 中 的 一 个 顶点 作为 源 点 。 这 个 过 程 的 时 间 复 杂 
度 为 O(w)。 本 节 用 动态 规划 算法 来 求解 。 该 算法 称 为 Floy 算法 ， 时 间 复 杂 度 为 802)。Floy 
算法 即使 在 边 长 为 负 值 时 也 适用 ( 不 过 环 路 的 带 权 长 度 不 能 是 负 值 )。 与 Floy 算法 相关 的 常 
数 因子 比 Dijkstra 算法 的 要 小 。 因 此 ，Floy 算法 比 最 坏 情况 下 的 Dijkstra 算法 用 时 要 少 。 

2. 动态 规划 公式 

假定 图 可 以 有 权 值 为 负 的 边 ， 但 不 能 有 带 权 长 度 为 负 值 的 环 路 。 因 此 ， 每 一 对 顶点 人 让 
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总 有 一 条 不 含 环 路 的 最 短路 径 。 

假设 图 G 有 nn 个 顶点 ， 且 从 1 到 nn 编号 。c(i,j,h) 表示 从 顶点 i 到 j 的 一 条 最 短路 径 的 长 
度 ， 其 中 间 顶 点 的 编号 不 都 大 于 k， 因 此， 如果 边 (i,)) 存在 ， 则 c(i,j,0) 是 该 边 的 长 度 。 若 
i=j， 则 c(i,j,0) 为 0。 如 果 边 (i,7) 不 存在 ， 则 c(i,j,0) 等 于 ww。c(i,j,n) 是 从 i 到 ) 的 最 短路 径 的 
长 度 。 

例 19-12 考察 图 17-17。 车 本 0,1,2,3， 则 ce(1,3,)= om ; c(1,3,4)=28 ; 车 有 5,6,7， 则 


c(13, 晶 =10; 车 8,9,10， 则 c(1.3, 日 =9。 因 此 从 1 到 3 的 最 短路 径 长 度 为 9。 于 
对 于 任意 k20， 如 何 确定 c(j 昌 呢 ? 从 i 到 7， 中 间 顶 点 不 超过 Kk 的 最 短路 径 有 两 种 可 


能 : 该 路 径 包 含 或 不 包含 中 间 顶 点 k。 若 不 包含 ， 则 该 路 径 长 度 应 为 c(i,j,k-1)， 否 则 长 度 为 
c(i,k,k-1)+c(k,j,k-1)。c(i,j, 可 取 两 者 中 的 较 小 值 。 因 此 可 得 到 如 下 递归 式 : 
c(ij,A=min{c(i, jk-1),c(ikk-1)+c(k, jk-1)}, k>0 
以 上 的 递归 公式 将 一 个 大 级 运算 转化 为 多 个 k-1 级 运算 ， 而 多 个 k-1 级 运算 应 比 一 个 大 级 运 
算 简单 。 
3. 递归 求解 
如 果 用 递归 方法 求解 上 式 ， 则 计算 过 程 的 复杂 度 将 无 法 估量 。 令 1(1) 为 递归 求解 c(i7 介 
的 时 间 。 根 据 递 归 式 可 以 看 出 xD=3(( 上 IDU+c。 利 用 替代 方法 可 得 (0D=@6G%。 因 此 所 有 
c(i,j,n) 的 计算 用 时 为 8(0737)。 
4. 迭代 求解 
通过 多 次 计算 c(i,j,k-1) 的 值 ， 可 以 得 到 c(i,j,n) 的 值 ， 这 是 一 种 非常 高 效 的 方法 。 如 果 
c(i,j,k) 的 值 不 用 重复 计算 ， 那 么 c 值 的 计算 用 时 可 以 减少 到 89(m)。 这 种 策略 可 以 通过 递归 来 
实现 ， 就 像 解决 矩阵 链 问题 一 样 ( 见 程序 19-6 )， 或 通过 迭代 来 实现 。 我 们 仅 讨论 迭代 法 。 首 
先 给 出 迭代 法 的 伪 代 码 ， 如 图 19-3 所 示 。 
1/ 寻找 景 短路 径 的 长 度 


/1/ 初始 化 c(i, j,0) 
forl(int i=1?;i<=n;i++) 


for (int j=1;j<=n;j++) 
c(i,j,0)=a(i,j); V/a 是 邻接 矩阵 的 耗 时 
// 计算 c(i,j,k)，0<k<=n 


for (int k=1,k<=nzrk++) 
for(int i=1;i<=n;i++) 
for(int j=1;j<=n;j++) 
if (c(i,k,k-1)+ce(k, j,k-1)<c (i,j,k-1)) 
C(ij,k)=e (i,k,k-1) +e(k, j,k-1i); 
else 
c(ijrk)=c (i 1) 7 





图 19-3 最 短路 径 的 初始 算法 


注意 ， 对 于 任意 i，c(i,k,k)=c(i,k,k-1) 且 c(hi, 忆 D=c(k,i,k-1)， 因 而 ， 若 用 c(i,j) 代替 图 19-3 
的 c(i,j,*)，c(i,j) 的 最 后 值 将 等 于 c(i,j,n) 的 值 。 

5. 用 C++ 实现 

根据 上 面 的 观察 结果 ， 图 19-3 的 伪 码 可 以 细 化 为 程序 19-8 的 C++ 代码 。 细 化 的 程序 利 
用 了 程序 16-2 中 定义 的 类 adjacencyWDigraph。 函 数 allPairs 在 c 中 返回 最 短路 径 的 长 度 。 若 
从 i 到 j 无 通路 ， 则 c[i][] 的 值 为 noEdge。 函 数 allPairs 还 计算 kay[i][ 首 ， 它 是 从 i 到 j 的 最 
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短路 径 中 最 大 的 大 值 。kay 值 可 以 用 来 构建 从 一 个 顶点 到 另 一 个 顶点 的 最 短路 径 ( 见 程序 19-9 
中 的 函数 outputPath )。 
程序 19-8 的 时 间 复 杂 度 为 9(n)。 程 序 19-9 用 时 O(n) 来 输出 一 条 最 短路 径 。 


程序 19-8 c 和 kay 的 计算 





template <class T> 

vOid allPairs(T **G, irnt **kay) 

{W 动态 设计 所 有 顶点 对 之 间 的 最 短路 径 算 法 

1 对 所 有 并 和 了， 计算 c[i][j] 和 kay[i] 1[j] 


/这 里 的 代码 用 来 检验 *this 是 否 为 加 权 图 


/初始 化 c[il[j] = c(i,j,0) 
Eor ‘(Ent EE = 1 


< Mm tT ) 
for (int J = 1 <= ny j+#) 


for (int i = 1; i <= n; i++) 
G1lE] 人 3 0% 


/计算 crilrj]l = c(i,j,k) 
for (int k = 1; k <= n; k++) 
for {int 1 = 17 和 <= ns i++) 
fo (Lint 3 = 1 3 < Ti +) 
if (c[i][k] != noEdge && c[k][j] != noEdge && 
(el411j] == nopdge [| cli 3 > cli] [XxX] + 有 CS (33) 
{1/ 找到 的 cIli] [j] 的 较 小 值 
lj] = 全 [让 LU # 可 ET 
kay[il[] = k; 


程序 19-9 ”输出 最 短路 径 


template <class T> 
void outputPath(T **c, int **kay, T noEdge, int i, int j) 


{/ 输出 从 i 到 j 的 最 短路 径 


if (c[i][j] == noEdge) 
cout << "There is no path from " << i << " to " << j << endl; 
else 


{ 
Scout < "The: path js " ge i ee T My 
outputPath (kay, 1,j); 
cout << endl; 


} 


void outputPath (int **kay, int i, int j) 
{1/ 输出 路 径 的 实际 代码 
i = 
return; 


if (kay[il][j] == 0) 1// 路 径 上 没有 中 间 顶 点 
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GOUt << 5 < 
else 
(1 kay [i]1j] 是 路 径 上 的 一 个 中 间 顶 点 
outputPath (kay, i, kay[i] (3]);? 
outputPath (kay, kay[li] [jij],7); 
} 
} 


例 19-13 图 19-4a 是 一 个 耗费 矩阵 a 的 实例 。 图 19-4b 是 由 程序 19-8 计 算出 的 c 甜 
阵 ， 图 19-4c 是 kay 值 。 从 kay 的 值 可 知 ， 从 1 到 5 的 最 短路 径 是 从 1 到 kay[1][5]=4 的 最 
短路 径 再 加 上 从 4 到 5 的 最 短路 径 。 因 为 kay[4][5]=0， 所 以 从 4 到 5 的 最 短路 径 无 中 间 顶 
点 。 从 1 到 4 的 最 短路 径 经 过 kay[1][4]=3。 重 复 以 上 过 程 ， 最 后 可 得 从 1 到 5 的 最 短路 径 为 : 
1,2,3,4,5。 


G1 生意 人 和 0023 4 
3 入 3 12 3 0 0@ 0.3 运 
2 人 双 、 妥 - 区 下 和 0000 4 
8 890 1 人 $$ 沪 污 内 So 3 和 人 力 
证 0 4 42 3 0 3 8 如 
a) b) c) 
图 19-4 最 短路 径 的 例子 [ 
19.2.4” 带 有 负 值 的 单 源 最 短路 径 
1. 问题 描述 
考虑 一 个 图 ， 它 的 顶点 表示 城市 ， 边 的 成 本 表示 从 一 个 城市 租 一 辆 车 ， 然 后 把 车 停 在 另 


一 个 城市 所 需 的 费用 。 然 而 ， 如 果 佛 罗 里 达州 的 净 移 民 是 正 数 ， 那 么 它 就 会 拥有 多 余 的 车 辆 ， 
而 净 移 民 为 负数 的 城市 就 会 缺少 车 辆 。 为 了 矫正 这 种 失衡 ,汽车 租赁 公司 实际 上 要 付 钱 请 人 
把 车 从 佛罗里达 州 的 一 个 城市 开 到 一 个 车 辆 不 足 的 城市 。 因 此 ， 对 租赁 公司 来 说 ， 相 应 边 的 
成 本 就 是 负 值 。 本 书 网 站 上 给 出 了 解决 调度 问题 的 方法 ， 以 及 一 个 在 带 有 负 的 边 成 本 的 图 中 
寻找 最 短路 径 的 差分 方程 系统 。 

当 有 向 图 带 有 其 权 小 于 0 的 边 时 ， 不 能 用 17.3.5 节 的 贪 禁 算 法 求 其 单 源 最 短路 径 ( 见 
练习 32 的 求解 方案 )。 然 而 ， 只 要 一 个 图 或 有 向 图 没有 其 带 权 长 度 小 于 0 的 环 路 ， 就 可 以 用 
19.2.3 节 的 动态 规划 算法 求 其 所 有 顶点 对 之 间 最 短路 径 。 如 19.2.3 节 所 述 ， 如 果 含 有 长 度 小 
于 0 的 环 路 ， 最 短路 径 无 法 明确 的 界定 ， 因 为 有 的 最 短路 径 可 以 含有 无 数 小 边 。 因 此 合理 的 
假设 是 ， 我 们 所 处 理 的 图 没有 其 长 度 小 于 0 的 环 路 。 

假定 我 们 要 研究 的 图 具有 其 权 小 于 0 的 边 ， 但 是 没有 带 权 长 度 小 于 0 的 环 路 。 由 于 
19.2.3 节 中 寻找 最 短路 径 的 动态 规划 算法 需要 用 时 8B(m)， 所 以 设计 一 个 用 时 较 少 的 单元 最 短 
路 径 算法 便 是 有 用 的 了 。 这 个 算法 在 使 用 邻接 矩阵 描述 时 ， 复 杂 度 是 O02)， 在 使 用 邻接 表 描 
述 时 ， 复 杂 度 为 O(ne)， 其 中 。 表示 边 数 。 因 此 ， 在 寻找 单 源 最 短路 径 时 ， 新 算法 比 19.2.3 节 
的 算法 具有 性 能 优势 。 这 个 新 算法 是 Bellman 和 Ford 发 明 的 ， 因 此 称 为 Bellman-Ford 算法 。 

2. 动态 规划 公式 

假设 下 面 的 图 没有 带 权 长 度 小 于 0 的 环 路 。 我 们 假设 ， 所 有 最 短路 径 最 多 具有 n-1 条 边 。 
注意 ,一 条 路 径 如 果 具 及 条 以 上 的 边 ， 那 么 一 定 有 环 路 ， 而 根据 假设 , 环 路 的 带 权 长 度 都 
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不 小 于 0， 因 此 去 掉 环 路 之 后 的 路 径 会 更 短 。 所 以 ,任何 两 个 联通 的 顶点 之 间 一 定 存在 不 含 
环 路 的 最 短路 径 ， 而 且 最 多 有 n-1 条 边 。 

如 在 17.3.5 节 和 19.2.3 节 中 那样 ， 我 们 首先 关注 最 短路 径 的 长 度 。 令 dv, 昌 表示 从 
源 点 到 顶点 v 且 最 多 有 上 条 边 的 最 短路 径 长 度 。 于 是 ，4d(v,n-1) 便 是 一 个 我 们 要 寻找 的 路 
径 长 度 。d(v,0) 表示 从 源 点 到 顶点 v 且 边 数 为 0 的 最 短路 径 长 度 。 显 然 v=s 时 ，d(v,0)=0， 
否则 为 无 穷 。 对 于 k>0， 最 短路 径 的 边 数 在 0 和 k 之 间 。 当 最 短路 径 上 的 边 数 至 少 是 1 
时 ， 有 

d(v,A=min{d(u,k-1)+cost(u,v)|(u,v) 是 图 的 一 条 边 } 
其 中 4 是 最 短路 径 上 愉 在 v 之 前 的 项 点 。 于 是 我 们 有 了 下 面 的 动态 规划 公式 : 
dV.)=min{d(v,0),min{d(u,k-1)+cost(u,v)|(u,v) 是 图 的 一 条 边 }} 
利用 这 个 递归 式 可 以 通过 按 序 计算 d(*,1)，d(*,2)，…，d(*,n-1) 而 得 到 d(*,n-1)。 

3. 迭代 求解 

虽然 我 们 可 以 用 递归 方法 和 无 重复 计算 的 递归 方法 求解 4d 的 动态 规划 方程 ， 但 是 迭代 法 
的 用 时 更 少 。 图 19-5 是 迭代 法 的 伪 码 。 


initialize d(*, 0); 

// 计算 其 余 的 dq (*,k) 

for (Int k=1;k<n;kt++) 
{ 


d(v,k)=qd(v,0) 对 所 有 Vi; 
for ( 每 一 条 边 (u,v)) 
dl(v,k)=min{d(v,k) ,d(u,k-1)+cost (u,v) } 7 





图 19-5 ”Bellman-Ford 算法 的 伪 码 
图 19-6 是 图 19-5 的 细 化 ， 其 中 4 的 计算 是 同 址 进行 的 ， 即 4 只 用 一 个 索引 。 


initialize d(*)=d(*,0); 
11 计 算 d(*)=d(*,n-1) 


for (int k=]; k<n;k++) 
for (每 一 条 边 (u,v)) 


d(v)=min{d(v) ,ad (u) +cost (u,v) }; 





图 19-6 ” 细 化 的 Bellman-Ford 算法 的 伪 码 


注意 ， 虽 然 外 层 循环 的 每 一 次 迭代 末端 的 同 址 计算 中 并 没有 d(*)=d(*,fj)， 但 是 结束 时 
d(*) 的 值 等 于 d(*,n-1)。 一 般 情况 下 ， 源 代码 在 每 一 个 顶点 上 执行 min 函数 n-1 次 ， 之 后 每 
一 个 顶点 v 都 不 能 再 通过 min 少数 而 减少 d(v) 的 值 。 修 改 后 的 同 址 代码 也 是 如 此 。 这 种 确定 
性 的 前 提 是 图 中 没有 带 权 长 度 为 负 的 环 路 。 实 际 上 在 循环 结束 时 ， 我 们 可 以 检查 d(v) 的 值 ， 
看 它 是 否 可 以 通过 伪 码 中 的 min 操作 而 减少 ， 如 果 是 ， 那 么 原 图 一 定 有 一 个 带 权 长 度 为 负 的 
环 路 。 

为 了 减少 计算 时 间 ， 还 可 以 进行 另外 两 种 观察 : 1) 如 果 对 某 个 k，d(v) 的 值 对 任意 都 
不 会 变化 ， 那 么 我 们 可 以 中 止 外 层 循环 ; 2 ) 仅 当 dl(w) 在 外 层 循环 的 先前 迭代 中 发 生变 化 时 ， 
仅 对 边 (u,v) 的 内 层 循环 才 是 需要 的 。 19-7 是 基于 这 种 观察 而 建立 的 Bellman-Ford 算法 的 
伪 码 。 
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initialize d(*)=d(*,0); 
把 与 源 点 相 邻 的 顶点 放 入 表 listl; 


1 计算 d(*)=d(*,n-1) 
把 源 点 放 入 listl; 
for (int kK=1;k<n;k++) 
{ 
1/ 查看 是 否 有 其 值 d 发 生变 化 的 顶点 
if (listl 为 空 ) 跳出 循环 ; /没有 这 样 的 顶点 
while (1istl 不 空 ) 
{ 
从 1istl 中 删除 一 个 顶点 zi 
for (每 一 条 边 (u,v)) 
{ 
d(v)=min{d(v) ,d(u) +cost (u,v) } 7 
if (d(v) 发 生变 化 而 且 y 不 在 1ist2 中 ) 把 加 到 1ist2; 
} 
Listl=List2. 
使 List2 为 空 ; 





图 19-7 Bellman-Ford 算法 最 后 的 伪 码 


4. 用 C++ 实现 

在 实现 图 19-7 的 伪 码 时 ， 引 入 一 个 数组 inList2 是 很 有 用 的 。 当 且 仅 当 顶 点 v 属 于 list2 
时 ，inList2[v] 为 true。 在 外 层 for 循 环 的 每 一 次 迭代 结束 时 ， 数 组 inList2 要 重新 赋值 为 
false。 这 项 操作 ， 通 过 寻找 数组 inListz 中 的 顶点 ,修改 相应 的 数组 值 ， 可 以 很 快 地 完成 。 

任何 一 个 表 结 构 ， 只 要 插 人 和 删除 时 间 是 常量 ， 就 可 以 用 在 实现 代码 中 ， 例 如 栈 或 队列 。 
但 是 我 们 使 用 了 arrayList， 因 为 我 们 为 这 个 类 定义 了 一 个 枚 举 器 ， 而 且 因为 这 个 类 比 其 他 线 
性 表 在 最 好 情况 下 有 更 好 的 性 能 。 使 用 枚 举 器 ， 在 外 层 for 循环 的 每 一 次 迭代 结束 时 ， 可 以 很 
容易 地 重新 设置 inList2 的 值 。 

程序 19-10 是 Bellman-Ford 算法 的 实现 代码 。 这 个 代码 包含 一 个 前 驱 数组 p， 如 程 
序 17-3 的 最 短路 径 代 码 中 的 一 样 。 利 用 p 的 值 ， 可 以 建构 最 短路 径 ， 如 练习 33 的 解答 中 所 
描述 的 那样 。 


程序 19-10 Bellman-Ford 算法 


void bellmanFordl(int s, T *d, int *p) 
{1/ 寻找 始 于 顶点 s 的 最 短路 径 的 Bellman-Ford 算法 
/途中 具有 权 值 为 负 的 边 ， 但 没有 带 权 长 度 为 负 的 环 路 
/ 始 于 s 的 最 短 距离 在 d 中 返回 
/前 驱 信 息 在 P 中 返回 
if (!weighted()) 
throw undefinedMethod 
("graph::bellmanFord() not defined for unweighted graphs"); 


int n = numberOfVertices (); 
让 在 fs hl s > nn) 
throw illegalParameterValue ("illegal source vertex"); 


// 定义 两 个 表 ， 存 储 其 d 值 发 生 改 变 的 顶点 


arrayList<int> *listl = new arrayList<int>; 
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arrayList<int> *list2 = new arrayList<int>; 


/定义 一 个 数组 ， 以 记录 表 1ist2 中 的 顶点 


bool *inList2 = new bool [n+1]; 


/初始 化 pb[1:n] = 0 和 inList2[1:n] = false 
ff311T(B 二 Ly Lp 
il (LinLiSt2 + 工 inList2 十 丰 沾 二 false}? 


/设置 d[s] = d*0(s) = 0 

dr[s] = 0; 

P[s] = s; /pril != 0 意味 着 已 经 到 达 顶 点 i 
1/ 后 面 将 重新 设置 p[s] = 0 


/初始 化 表 1ist1l 
listl->insert(0, s); 


ln - 1 次 循环 ， 更 新 Qa 值 
fw int ke li Ee mn kt+) 
{ 
if (list1l->empty ()) 
break; /不 再 有 改变 
/处 理 表 Listl 中 的 顶点 


for (arrayList<int>:;iterator iListl = listl->begin(); 
iListl != listl->end(); ++iListl) 
{1/ 对 顶点 u = *iListl 的 邻接 点 v， 更 新 其 d 的 值 
int u = *iListl; 
vertexIterator<T> *iu = iterator (u); 
nT 
T wi? 
while ((v = iu->next (w)) != 0) 
{ 
证 ET == 0 Wl Au FF ws lv)) 


1 
/或 是 到 达 v 的 第 一 条 路 径 ， 或 是 更 短 的 一 条 路 径 
dfvl = d[u] + w; 
PpP[lv] = u; 
/把 加 入 Iist2， 除 非 v 已 经 存在 
if (!inList2[v]) 


{1/ 加 到 表 昆 
list2->insert (list2->size(), v); 
inList2[v] = true; 


} 


/为 下 一 轮 更 新 ， 重 新 设计 表 1ist1 和 1ist2 的 值 
1ist1l = list2; 
list2 = new arrayList<int>; 


/重新 设置 inList2[1:n] 为 false 
for (arrayList<int>::iterator iListl = list1l->begin(); 
iDist1l != listl->end(); ++iList1) 
inList2[*iListi] = false; 
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Pls] = 0; Ms 没有 前 驱 


一 个 大 值 要 迭代 O(e) 次 (e 是 边 数 )。 因 此 ，for(int k…) 循环 的 每 一 次 选 代 ， 在 使 用 邻接 矩阵 
描述 时 ， 其 复杂 度 为 O02); 当 使 用 邻接 表 描 述 时 ， 其 复杂 度 为 O(e)。 所 以 ， 总 的 时 间 复 杂 度 ， 
在 使 用 邻接 矩阵 描述 时 为 O(m)， 当 使 用 邻接 表 描 述 时 为 O(ne)。 


19.2.5 网 组 的 无 交叉 子 集 


1. 问题 描述 

在 14.6.3 节 的 交叉 分 布 问题 中 ,给 定 一 个 上 下 两 边 有 nn 个 针脚 的 布线 通道 和 一 个 排列 
C。 顶 部 的 针脚 i 与 底部 的 针脚 C, 相连 ， 其 中 1 < i<n。 数 对 (i,0) 称 为 网 组 。 总 共有 7 
个 网 组 需 连 接 或 连通 。 假 定 有 两 个 或 更 多 的 布线 层 ， 其 中 有 一 个 为 优先 层 。 与 其 他 布线 层 
相 比 ， 优 先 层 的 连 线 更 细 ， 电 阻 也 要 小 得 多 。 我 们 的 任务 是 尽 可 能 把 更 多 的 网 组 布设 在 优 
先 层 。 把 剩 下 的 网 组 布设 在 其 他 层 。 当 且 仅 当 两 个 网 组 没有 交叉 时 ， 它 们 可 布设 在 同一 层 。 
因此 我 们 的 任务 等 价 于 寻找 一 个 最 大 无 交叉 子 集 ( maximum noncrossing subset，MNS)。 
在 该 集中 ， 任意 两 个 网 组 都 不 交叉 。 因 为 网 组 (CD) 完全 由 i 决定 ， 因 此 可 用 i 来 表示 
(i,Ci)o 

例 19-14 考察 图 19-8 所 示 的 图 14-7。 网 组 (1,8) 和 (2,7) ( 即 1 号 网 组 和 2 号 网 组 ) 交 
叉 ， 因 而 不 能 布设 在 同一 层 。 而 网 组 (1,8)、(7,9) 和 (9,10) 未 交叉 ， 因 此 可 以 布设 在 同一 层 。 
但 这 3 个 网 组 并 不 能 构成 一 个 MNS， 因 为 还 有 更 大 的 不 交叉 子 集 。 在 图 19-8 给 出 的 例子 中 ， 
4 个 网 组 构成 的 集合 {(4,2),(5,5),(7,9),(9,10)} 是 一 个 MNS。 





C=[8,7,4,2,5,1,9,3,10,6] 
图 19-8 布线 举例 国 


2. 动态 规划 公式 

令 MNS(i,j) 代表 一 个 MNS， 其 中 所 有 的 网 组 (wu,C,) 满足 u < i，C, < j。 仿 size(i,/) 表 
示 MNS(i,j) 的 大 小 ( 即 网 组 的 数目 )。 显 然 MNS(n,n) 是 对 应 于 输入 实例 的 一 个 MNS， 而 
size(n,n) 是 它 的 大 小 。 

例 19-15 对 于 图 19-8 中 的 例子 ，MNS(10,10) 是 我 们 要 找 的 最 终结 果 。 如 例 19-14 中 
所 指出 的 那样 ，size(10,10)=4。 因 为 (1,8)，(2,7)，(7,9)，(8,3)，(9,10) 和 (10,6) 中 要 么 顶部 针 
脚 编号 比 7 大 ， 要 么 底部 针脚 编号 比 6 大 ， 所 以 它们 都 不 属于 MNS(7,6)。 于 是 ， 只 需 判定 剩 
下 的 4 个 网 组 是 否 属于 MNS(7,6)， 如 图 19-9 所 示 。 子 集 {(3,4),(5,5)} 是 大 小 为 2 的 无 交叉 子 
集 。 没 有 大 小 为 3 的 无 交叉 子 集 。 因 此 size(7,6)=2。 
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Cs ee = 二 如 涛 一 





1 2 3 区 5 6 7 8 9 10 
图 19-9 图 19-8 中 可 能 属于 MNS(7,6) 的 网 组 国 


当 i=1 时 ，(1,C1) 是 MNS(1,7) 的 唯一 候选 。 仅 当 / = C1 时 ， 这 个 网 组 才 会 是 MNS(1,7) 
的 成 员 ， 即 
0 jG 
i 天 区 :在 
一 步 考 虑 i>1 时 的 情况 。 车 j<C;， 则 网 组 (i,C) 不 可 能 是 MNS(i,j) 的 成 员 。 所 有 属于 
MNS(i,) 的 网 组 (4,C,) 都 满足 wu<i 上 且 C,<j， 因 此 : 
size(i,7 )=size(i—1,j), j<C; (19-6) 
车 j 宇 C;， 则 网 组 (i,Ci) 可 能 属于 MNS(i,j) 也 可 能 不 属于 。 车 (i,0)) 属于 MNS(i,j)， 
则 MNS(i,/) 中 不 会 有 这 样 的 网 组 (w,C,) : u<i 且 Cs>C;， 因 为 这 样 的 网 组 必 与 (i,C) 相交 。 
MNS(i,j) 中 的 其 他 所 有 网 组 都 必须 满足 条 件 wu<i 且 Cs<C;。 在 MNS(i,j) 中 这 样 的 网 组 必 有 
Mi_1,Ci-i1 个， 否则 ，MNS(Gy) 就 不 会 有 最 大 数量 的 可 能 的 网 组 。 若 (i,C;) 不 在 MNS(i,j) 中 ， 
则 MNS(Gi,7) 中 的 所 有 网 组 (wu,C) 必须 满足 u<i; 因此 size(i,j)=size(i-1,7)。 昌 然 不 能 确定 (i,C)) 
是 否 属于 MNS(i,j), 但 是 结果 必须 是 使 MNS 更 大 。 因 此 
size(i,j )=max {size(i—1,/),size(i-l,C-1)+1}, jC.; (19-7) 


size (1,)) -| (19-5) 


3. 迭代 求解 

虽然 从 公式 (19-5) 到 公式 (19-7) 式 可 用 递归 法 求解 ， 但 是 从 前 面 的 例子 可 以 看 出 ， 即 使 
避免 了 重复 计算 ,动态 规划 递归 算法 的 效率 也 不 够 高 。 因 此 我 们 只 考虑 迭代 方法 。 在 迭代 过 
程 中 先 用 公式 (19-5) 计算 size(1,j)。 然 后 用 公式 (19-6) 和 公式 (19-7) 按 i=2,3…,n 的 顺序 计算 
size(i,ij)。 最 后 用 traceback 确定 MNS(n,n) 中 的 所 有 网 组 。 

例 19-16 图 19-10 给 出 了 图 19-8 中 对 应 的 size(i,j) 值 。 因 size(10,10)=4， 可知 MNS 含 
4 个 网 组 。 为 找到 这 4 个 网 组 ， 我 们 从 size(10,10) 入 手 ， 用 公式 (19-7) 算出 size(10,10)。 根 据 
公式 (19-7) 的 产生 过 程 我 们 知道 ，size(10,10)=size(9,10)， 因 为 一 个 具有 4 网 组 的 MNS 不 可 
能 具有 10 号 网 组 。 现 在 我 们 要 寻找 MNS(9,10)。 由 于 站 
size(9,10) 关 size(8,10)， 所 以 MNS(9,10) 必 包 含 9 号 网 组 。 
MNS(9,10) 中 剩 下 的 网 组 构成 MNS(8,Co-1)=MNS(8,9)。 
由 size(8,9)=size(7,9) 可 知 ，8 号 网 组 可 以 被 排除 。 接 下 来 
确定 MNS(7,9)。 因 为 size(7,9) 关 size(6,9)， 所 以 MNS(7,9) 
必 合 7 号 网 组 。MNS(7,9) 中 余下 的 网 组 构成 MNS(6,Cy-1)= 
MNS(6,8)。 根 据 size(6,8)=size(5,8) 可 排除 6 号 网 组 。5 号 
网 组 加 入 MNS 中 ， 然 后 我 们 要 确定 MNS(4,Cs-1)= 
MNS(4.4)。4 号 网 组 被 排除 ， 然 后 3 号 网 组 加 入 MNS 中 。 图 19-10 图 19-8 对 应 的 size(i,j) 
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回溯 过 程 得 到 MNS 的 4 个 网 组 为 {3,5,7,9}。 男 
注意 ， 在 回溯 过 程 中 未 用 到 size(10,7)(i 关 10)， 因 此 不 必 计 算 这 些 值 。 
4. C++ 实现 


程序 19-11 用 迭代 法 计算 size(i,j) 和 MNS。 函 数 mns 利用 二 维 数组 size 计算 size(i,j) 
的 值 。size[i][] 表示 size(i,j)， 其 中 i=j=n 或 1 < i<n, 0 <j<n。 计算 过 程 的 时 间 复 杂 度 为 
(mn)。 程 序 19-12 的 函数 traceback 在 net[0:sizeOfMNS] 中 返回 MNS 的 网 组 。 其 时 间 复 杂 度 
为 9(n)。 因 此 求解 MNS 问题 的 动态 规划 算法 其 总 的 时 间 复 杂 度 为 80)。 


程序 19-11 计算 size(i,j) 
void mns(int *c, int numberOfNets, int **size) 
{1/ 对 所 有 二 和 上 j， size[i]{[j] 
/初始 化 [1] [ 


for (int J 三 ~ 要 妆 已 ] 业 ] 夹 本 9 
size[1][j] = 0; 

for (int jj] = c[l]; j <= numberOfNets; j++) 
size[1][3j] = 1; 


/计算 size[il[*]，1 < i < numberOfNets 
for (int i = 2; i < numberOfNets; i++) 
{ 


For (wn 世 吉 圭 O03 3 奖 怒 [1 J 二】 
sizeli] [3] = Sizeli ~ 1]1313 
for (int J = cIil]; j <= numberOfNets; j++) 
sizeli][j] = max(sizel[i = 1] [ij3], sizel[li = 414]j[le[li] = 1] + 1)} 


size[lnumberOfNets] [numberOfNets] = 
max (sizelnumberOfNets - 1] [numberOfNets], 
size[numberOfNets - 1][c[numnberOfNets]l - 1] + 1)，; 





程序 19-12 ”查找 网 络 中 最 大 的 无 交叉 子 集 


int traceback (int xc int numberOfNets, int **size, int *net) 
{1/ 把 最 大 的 无 交叉 网 组 存 入 net [0:sizeOfMNS-1] 
/返回 MNS 的 大 小 
int maxAllowed = numberOfNets; 1/ 允许 的 最 大 底部 管 脚 数目 
int sizeOfMNS = 0; 
for (int 1 = numberOfNets; 1 > 1; i=—) 


1/ 网 组 i 属于 MNS 吗 


if (size[i] [maxAllowed] != size[i - 1] [maxAllowed]) 
{1/ 属于 

net [sizeOfMNS++] = i; 

maxAllowed = c[i] - 1; 


} 
1/1 号 网 组 属于 MNS 吗 
if (maxAllowed >= c[1]) 


net[sizeOfMNS++] = 1; // 属于 


return sizeOfMNS,; 
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练习 


1. 令 n=5，p=[7,3,5,2,4]，w=[3,1,2,1,21]|，c=6。 模 仿 图 19-1 画图 ， 显 示 程 序 19-1 的 递归 函数 。 
用 ? 值 标志 节点 .用 阴影 表示 重复 计算 的 节点 。 

2. 使 用 练习 1 的 数据 ， 建 立 一 个 类 似 图 19-2 的 表 。 使 用 程序 19-3 的 迭代 函数 。 从 /1,c) 回 
滴 ， 然 后 确定 x; 值 。 

3. 修改 程序 19-1， 使 它 同时 可 以 计算 导致 最 优 装载 的 x; 值 。 

4. 编写 一 个 C++ 代码 以 实现 元 组 方法 。 你 的 代码 应 该 确定 最 优 装 载 的 x; 值 。 

5. 定义 0/1/2 背包 问题 为 : 


max >， Dix 
限制 条 件 为 : 
Dwx<cHxe{0,1,2}), 1<ign 
i=} 


设 f 的 定义 和 0/1 背包 问题 中 的 定义 相同 。 
1 ) 从 0/12 背包 问题 中 推出 类 似 于 公式 (19-1) 和 公式 (19-2) 的 公式 。 
2 ) 假设 ws 为 整数 。 编 写 一 个 类 似 于 程序 19-3 的 函数 来 计算 二 维 数 组 f， 然 后 确定 最 优 分 
配 的 x 值 。 
3 ) 程序 的 复杂 度 是 多 少 ? 
6. [二 维 背包 ] 二 维 0/1 背包 问题 的 定义 为 : 


max > DiX: 
限制 条 件 为 : 全 


Dvxn<c wx<dHxe{0,l}, 1<ign 
人 i=1 


设 f(i,y,z) 为 二 维 背 包 问 题 最 优 解 的 值 ， 其 中 物品 为 i 到 n，c=y，dqd=z。 

1 ) 模仿 公式 (19-1) 和 公式 (19-2)， 确 定 关于 f(n,y,z) 和 JGi,y,z) 的 公式 。 

2 ) 假设 vs 和 ws 为 整数 。 编 写 一 个 类 似 于 程序 19-3 的 函数 ,计算 三 维 数组 f/， 然 后 确定 最 
优 分 配 的 x 值 。 

3 ) 程序 的 复杂 度 是 多 少 ? 

7. 使 用 和 矩 阵 链 问题 的 动态 规划 递归 式 计 算 c(i,j) 和 kay(i,j), 1 i<j<g, g=5，, 
r=(100,10,100,2,50,4)。g 个 矩阵 相 乘 的 最 优 顺序 需要 耗 时 多 少 ” 使 用 kay 值 来 确定 这 个 最 优 
顺序 。 

8. 在 4=6 和 7=(2,100,4,100,2,200,3) 的 条 件 下 ， 做 练习 7。 

9. 证 明 : 


2s(q9-s+1)= 0(g) 


10. 矩阵 乘法 递归 式 的 求解 仅 用 到 < 和 kay 的 上 三 角 元 素 。 重 写 程序 19-7 的 代码 ， 定 义 c 和 
kay 为 类 upperTriangularMatrix 的 成 员 ( 见 7.3.4 节 )。 分 别 评 价 二 维 数 组 描述 和 上 三 角 算 
阵 描述 的 优点 。 

11. 使 用 所 有 顶点 对 之 间 最 短路 径 问 题 求解 的 动态 规划 递归 公式 ， 确 定 图 17-9 中 所 有 c(i,j,k) 
的 值 . 用 敌阵 c(*.*, 的 序列 显示 结果 ， 一 个 上 对 应 一 个 矩阵 。 还 要 给 出 用 Floyd 算法 得 
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到 最 终 的 kay 数组 。 

.生成 一 个 与 图 17-9 的 有 向 图 对 应 的 无 向 图 ( 即 用 无 向 边 代 替 有 向 边 )。 以 这 个 图 为 条 件 做 

练习 11。 

. 编写 程序 19-8 的 一 个 版 本 ， 它 使 用 的 是 类 linkedWDigraph 的 成 员 。 这 个 版 本 的 渐 近 复杂 

度 应 该 与 程序 19-8 的 一 样 。 

. 设 G 为 有 nn 个 顶点 的 加 权 有 向 无 环 图 。 顶 点 编号 从 1 到 n， 且 当 (i,j) 为 G 中 的 一 条 边 时 

有 i<j。 设 1(i,/) 为 边 (57) 的 长 度 : 

1 ) 用 动态 规划 方法 计算 图 G 中 最 长 路 径 的 长 度 。 算 法 的 时 间 复 杂 度 应 为 O(n+e)， 其 中 e 
为 G 中 的 边 数 。 

2 ) 编写 一 个 函数 ， 利 用 1 ) 的 结果 构造 最 长 路 径 ， 其 复杂 度 应 为 0(p)， 其 中 为 该 路 径 
中 的 顶点 数 。 

.[ 反 身 传递 闭 包 ] 改写 程序 19-8。 从 一 个 有 癌 图 的 邻接 矩阵 开始 ， 计 算 其 反 身 传递 闭 包 拢 

阵 rte。 车 从 顶点 i 到 顶点 j 存在 有 向 路 径 (可 以 包含 零 条 边 ， 这 时 i=j )， 则 rtc[i][j]=1， 和 否 

则 rtc[i]j]=0。 代 码 的 复杂 度 应 为 0(wr*)， 其 中 为 图 中 的 项 点 数 。 

.已 知 C=[4,2,6,8,9,3,1,10,7,5]， 用 公式 (19-5 ) 到 公式 (19-7 ) 计算 size 值 。 像 图 19-10 那 

样 显 示 你 的 计算 结果 。 用 这 些 结果 确定 MNS。 

17. 由 17.3.3 节 可 知 ， 一 个 工程 可 分 解 为 若干 个 任务 ， 这 些 任务 可 按 拓扑 顺序 来 完成 。 设 任务 
从 1 到 nn 编号 ,首先 完成 任务 1， 然 后 完成 任务 2， 以 此 类 推 。 假 定 每 个 任务 有 两 种 方法 
来 完成 。 令 Ci 表示 用 第 一 种 方法 完成 任务 i 时 的 耗 时 ，C, 表示 用 第 二 种 方法 完成 任务 i 
时 的 耗 时 。 令 五 为 第 一 种 方法 中 任务 i 的 用 时 ，7;; 为 第 二 种 方法 中 任务 i 的 用 时 。 并 假 
设 T 为 整数 。 设 计 一 个 动态 规划 算法 ， 确 定 在 时 间 t 内 完成 所 有 任务 的 耗 时 最 少 的 方法 。 
假定 工程 的 耗 时 为 各 任务 耗 时 之 和 ， 总 时 间 是 各 任务 用 时 之 和 。( 提示 : 可 设 c(i,j) 为 在 j 
时 间 内 完成 任务 i 到 n 的 最 小 耗 时 )。 算 法 的 复杂 度 是 多 少 ? 

18. 一 台 机 器 有 个 零件 。 每 个 零件 有 三 个 供应 商 ， 来 自 供应 商 j 的 零件 i 的 重量 为 WW;, 价 

格 为 Cij (1 夺 j 三 3)。 机 器 的 价格 等 于 所 有 零件 价格 之 和 ， 重 量 也 为 各 零件 重量 之 和 。 

假设 所 有 价格 都 是 正 整数 。 设 计 一 个 动态 规划 算法 ， 以 决定 在 总 价格 不 超过 c 的 条 件 下 ， 

从 哪些 供应 商 购 买 零件 能 组 成 最 轻 的 机 器 。( 提示 : 可 设 w(i,j) 为 价格 不 超过 j 时 由 零件 i 

到 2 组 成 的 最 轻 机 器 )。 算 法 的 复杂 度 是 多 少 ? 

. 设 w(i,j) 为 价格 不 超过 7 时 由 零件 1 到 i 组 成 的 最 轻 机 器 。 以 此 为 前 提 ， 做 练习 18。 

.[ 最 长 公共 子 串 ] 串 s 是 串 a 中 去 掉 某 些 字符 之 后 的 子 串 。 如 串 “onion” 为 串 “Tecognition” 

的 子 串 。 捉 s 是 串 a 和 串 b 的 公共 子 串 ， 当 且 仅 当 它 既是 a 的 子 串 又 是 5b 的 子 串 。 串 s 的 

长 度 是 其 中 的 字符 个 数 。 设 计 一 个 动态 规划 算法 ， 寻 找 串 a 和 串 娟 的 最 长 公共 子 串 。( 所 

示 : 设 a=aia2…an，b=b1b2…bm。 定 义 1(i,j) 为 串 ai…as 和 bj…b, 的 最 长 公共 子 串 的 长 度 )。 

算法 的 复杂 度 是 多 少 ? 

.将 4 站 定义 为 串 aaz…a 和 bb2… 访 的 最 长 公共 子 串 的 长 度 ， 在 此 前 提 下 ， 重 做 练习 
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22.[ 最 长 有 序 子 序列 ] 编写 一 个 算法 ， 在 一 个 整数 序列 中 寻找 一 个 最 长 有 序 子 序列 ( 见 练习 
20 )。 算法 的 复杂 度 是 多 少 ? 


23. 令 xx2… 是 一 个 整数 序列 。 令 sum(i))= Yn ，i 硅 j。 编 写 一 个 算法 ， 寻 找 使 sum(i,j) 最 
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MD 
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LD 


fa 
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fs 
wn 


PE 
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DN 一 
SO 


2 
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大 的 i 和 j。 给 出 算法 的 复杂 度 。 

24. [ 串 编辑 ] 在 串 编辑 问题 中 ， 给 定 两 个 串 a=aia2…as 和 b=b1b2…bn 以 及 三 个 时 间 耗 费 
函数 C、D 和 7。 其 中 C(i, 让 为 将 a; 改 为 bj; 的 耗费 ，D(i) 为 从 a 中 删除 a; 的 耗费 ，7(i) 
为 将 bj; 插入 a 中 的 耗费 。 通 过 修改 、 删 除 和 插入 操作 可 把 串 a 改 为 囊 5。 这 样 的 操作 序 
列 称 为 编辑 序列 。 如 ， 删 除 所 有 a;， 然 后 插入 所 有 bi; ; 或 者 当 n 二 m 时 ， 先 把 a 变 成 
b; (1 三 i < n)， 然 后 删除 其 余 的 a;。 一 个 操作 序列 的 耗费 为 各 个 操作 的 耗费 之 和 。 设计 
一 个 动态 规划 算法 ， 确 定 一 个 耗费 最 少 的 编辑 操作 。( 提示 : 定义 c(i,j) 为 将 alaz…ai 转 
变 为 p1b，…b) 的 最 少 耗费 )。 算法 的 复杂 度 是 多 少 ? 

25. 使 用 动态 规划 做 第 17 章 的 练习 41。 


19.3 ”参考 及 推荐 读物 


用 时 为 O(nlogn) 的 矩阵 乘法 链 问 题 的 算法 可 参考 论文 : T. Hu, M. Shing. Computation of 
Mairix Chain Products, Part [ & .SIAM Journal on Computing, 11, 1982, 362-372 and 13, 1984, 
228-251. 

网 组 无 交叉 子 集 问题 的 动态 规划 算法 参考 了 论文 : K. Supowit. Finding a Maximum Planar 
Subset of a Set of Nets in a Channel. IEEE Transations on Computer-Aided Design of Integrated 
Circuits and Systems, 6, 1, 1987. 93-94. 


第 20 登 | 


Data Structures, Algorithms, and Applications in C++, Second Edition 


回 漳 法 





概述 


要 求解 一 个 问题 ， 最 可 靠 的 一 种 方法 是 : 列 出 所 有 候选 解 ， 然 后 逐个 检查 ， 在 检查 所 有 
或 部 分 候选 解 之 后 ， 便 可 找到 所 需要 的 解 。 理 论 上 ， 只 要 候选 解 的 数量 有 限 ， 而 且 在 检查 了 
所 有 或 部 分 候选 解 之 后 可 以 确定 所 需 解 ， 这 种 方法 就 是 可 行 的 。 不 过 在 实际 应 用 中 ， 这 种 方 
法 很 少 用 ， 因 为 候选 解 的 数量 通常 都 非常 大 〈 比如 是 实例 大 小 的 指数 级 ， 甚 至 是 阶乘 )。 而 即 
使 速度 最 快 的 计算 机 ， 也 只 能 对 实例 规模 相当 小 的 问题 在 合理 的 时 间 内 解决 。 

回溯 法 和 分 支 定 界 法 是 对 候选 解 进 行 系统 检查 的 两 种 方法 。 这 两 种 方法 使 最 坏 情 况 下 和 
一 般 情况 下 的 求解 时 间 大 大 减少 。 事实 上 ， 这 两 种 方法 使 我 们 省 去 了 对 很 大 一 部 分 候选 解 的 
检查 ， 同 时 还 使 我 们 能 够 找到 所 需要 的 解 。 因 此 ， 这 两 种 方法 经 常 可 以 用 来 求解 实例 规模 很 
大 的 问题 。 

本 章 集中 论述 回溯 法 。 用 这 种 方法 设计 的 算法 有 货 箱 装 载 、 背 包 、 最 大 完备 子 图 、 旅 行 
商 和 电路 板 排 列 。 其 中 每 一 个 应 用 都 是 NP- 复杂 问题 。 当 我 们 需要 NP- 复杂 问题 的 最 优 解 
时 ,使 用 回溯 法 和 分 支 定 界 法 来 系统 检查 候选 解 经 常 可 以 得 到 最 好 的 算法 。 


20.1 算法 思想 


回溯 法 ( backtracking ) 是 搜索 问题 解 的 一 种 系统 方法 。8.5.6 节 中 迷宫 老鼠 问题 的 解法 
采用 了 这 种 技术 。 回 溯 法 求解 首先 需要 定义 问题 的 一 个 解 空间 ( solution space )。 这 个 空间 
至 少 包 含 问题 的 一 个 ( 最 优 的 ) 解 。 在 迷宫 老鼠 问题 中 ， 我 们 可 以 把 从 入 口 到 出 口 的 所 有 路 
径 定 义 为 解 空间 ,在 n 个 对 象 的 0/1 背包 问题 中 ( 见 17.3.2 节 . Pa 
和 19.2.1 节 )， 可 以 把 2 个 长 度 为 二 的 0/1 向 量 的 集合 定义 为 解 (0) Wa ee 
空间 。 这 个 集合 代表 着 向 量 x 取 值 0 或 1 的 所 有 可 能 。 当 n=3 
时 ， 解 空间 为 {(0,0,0),(0,1,0),(0,0,1),(1,0,0),(0,1,1D),(1,0,D,(1,1,0)， 一 、 a 
Cl (21) 2)—{(23) 

回溯 法 求解 的 下 一 步 是 组 织 解 空 间 ， 使 解 空间 便于 搜索 。 
典型 的 组 织 方法 是 图 或 树 。 图 20-1 用 图 形 结构 描述 了 一 个 








< 














3 x 3 迷宫 的 解 空间 。 从 顶点 (1,1) 到 顶点 (3,3) 的 每 一 条 路 径 都 《3 G2) (33) 
是 解 空 间 的 一 个 元 素 。 但 考虑 到 障碍 的 设置 ， 有 些 路 径 可 能 是 、 一 


图 20-2 用 树 形 结构 描述 了 三 个 对 象 的 0/1 缘 包 问题 的 解 空间 。 从 i 层 节 点 到 i+1l 层 节点 
的 边 上 所 标志 的 数字 表示 x; 的 值 。 从 根 节点 到 叶 节 点 的 每 一 条 路 径 都 是 解 空 间 的 一 个 元 素 。 
从 根 节点 A 到 叶 节 点 H 的 路 径 所 表示 的 解 为 x=[1,1,1]。 根据 w 和 ec 的 值 ， 从 根 节点 到 叶 节 点 
的 路 径 中 一 部 分 或 全 部 都 可 能 不 是 解 。 
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一 旦 确定 了 解 空 间 的 组 织 方 法 ， 这 个 空间 即 可 按 深 度 优先 方式 从 开始 节点 进行 搜索 。 在 
迷宫 老鼠 问题 中 ， 开 始 节点 为 入 口 节点 (1,1) ; 在 0/1 背包 问题 中 ， 开 始 节点 为 根 节 点 。 开 始 
节点 既是 一 个 活动 节点 ( live node ) 又 是 一 个 E- 节 点 (expansion node )。 从 E- 节 点 我 们 试 着 


点 和 新 的 EE- 节点 。 而 原来 的 E- 节 点 仍 是 一 个 活动 节点 。 如 果 不 能 移 到 一 个 新 节点 ,那么 当前 
E- 节 点 “ 死 掉 ”"， 即 不 再 是 活动 节点 。 然 后 我 们 回 到 最 近 的 活动 节点 。 这 个 活动 节点 变 成 了 新 
的 E- 节 点 。 当 我 们 已 经 找到 了 答案 或 者 不 再 有 活动 节点 时 ， 搜 索 过 程 结 束 。 

例 20-1[ 迷宫 老鼠 ] 图 20-3a 的 矩阵 是 3x3 的 “迷宫 老鼠 ”问题 实例 。 我 们 用 图 20-1 
的 解 空 间 图 形 结构 来 搜索 迷宫 。 


0 0 0 1 1 0 Wk Wk 

从 迷宫 入 口 到 出 口 的 每 一 条 路 径 都 与 图 20-1 中 从 (1,1) oo 1 1 和 人 0 1 1 

到 (3,3) 的 一 条 路 径 相 对 应 。 然 而 ， 图 20-1 中 有 些 从 (1,1) 0 0 0 0 和 0 0 0 0 
a) C) 


到 (3,3) 的 路 径 却 不 是 迷宫 中 从 入 口 到 出 口 的 路 径 。 

搜索 从 点 (1,1) 开始 ， 它 是 此 时 唯一 的 活动 节点 ， 它 图 20-3 迷宫 
也 是 一 个 E- 节 点 。 为 避免 重复 走 过 这 个 位 置 ， 置 maze(1,1) 为 1。 从 这 一 点 能 移动 到 (1,2) 或 
(2,1) 两 个 点 。 就 本 例 而 言 ， 两 种 移动 都 是 可 行 的 ， 因 为 这 两 个 位 置 上 的 值 都 是 0。 假定 我 们 
选择 (1,2)， 把 maze(1,2) 置 为 1。 迷宫 当前 状态 如 图 20-3b 所 示 。 这 时 我 们 有 两 个 活动 节点 
(1,1) 和 (1,2)。(1,2) 还 成 为 E- 节 点 。 在 图 20-1 中 从 当前 E- 节 点 开始 有 3 个 可 能 移动 到 的 位 置 ， 
但 其 中 两 个 是 不 可 行 的 ， 因 为 这 些 位 置 上 的 值 为 1。 唯一 可 移动 到 的 位 置 是 (1,3)。 移 动 到 这 
个 位 置 ， 并 置 maze(1,3) 为 1。 此 时 迷 富 状态 为 图 20-3c 所 示 ，(1,3) 成 为 E- 节 点 。 在 图 20-1 
中 ， 从 (1,3) 出 发 有 两 个 可 能 移动 到 的 位 置 ， 但 没有 一 个 是 可 行 的 。 所 以 该 节点 也 就 “死亡 ” 
了 。 我 们 回溯 到 最 近 的 活动 节点 (1.2)， 但 是 在 这 个 节点 已 经 没有 剩 下 可 移 到 的 位 置 ， 所 以 这 
一 节点 也 “ 死 了 ”。 唯 一 留 下 的 活动 节点 是 (1,1)。 这 个 节点 再 次 变 为 E- 节 点 ， 从 此 点 可 移动 
到 (2,1)。 现 在 的 活动 节点 为 (1,1) 和 (2,1)。 这 样 继续 下 去 ,我 们 能 达到 (3,3)。 此 时 ， 活动 节 
点 表 为 (1,1)，(2,1)，(3,1)，(3,2)，(3,3)， 这 便 是 到 达 出 口 的 路 径 。 男 

程序 8-15 是 一 个 寻找 迷宫 路 径 的 回 淹 算 法 。 

例 20-2[0/1 背包 问题 ] 考察 如 下 背包 问题 : n=3, w=[20,15,15],p=[40,25,25]，c=30。 
从 根 节点 开始 搜索 图 20-2 中 的 树 。 根 节点 是 当前 唯一 的 活动 节点 ， 也 是 E- 节 点 。 从 这 里 能 够 
移动 到 节点 B 或 C。 假定 移动 到 B， 则 当前 的 活动 节点 为 A 和 B。B 也 是 当前 的 E- 节 点 。 在 
节点 B， 剩 余 容量 + 为 10， 而 收益 cp 为 40。 从 B 点 可 能 移动 到 D 或 E。 但 移动 到 D 是 不 可 
行 的 ， 因 为 移动 到 D 所 需 的 容量 w; 为 15。 移 动 到 E 是 可 行 的 ， 因 为 这 个 移动 不 占用 任何 容 
量 。E 变 成 新 的 E- 节 点 。 这 时 活动 节点 为 A、B、E。 在 节点 E，r=10，cp=40。 我 们 从 E 点 
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有 两 种 可 能 移动 到 的 位 置 : ] 和 KK。 移动 到 J 是 不 可 行 的 ， 而 移动 到 K 是 可 行 的 。 节 点 变 
成 了 新 的 E- 节 点 。 因 为 KK 是 一 个 叶 节 点 ， 所 以 得 到 一 个 可 行 解 。 这 个 解 的 收益 cp=40。x 的 
值 由 根 到 及 的 路 径 来 决定 。 这 个 路 径 (A，B，E,，K ) 也 是 此 时 的 活动 节点 序列 。 因 为 K 节 
点 不 能 进一步 扩充 ， 所 以 K 节点 死亡 ， 我 们 回溯 到 E。 而 正点 也 不 能 进一步 扩充 ， 它 也 死亡 
a 

接着 我 们 回溯 到 B， 它 也 死亡 了 ，A 再 次 变 为 E- 节 点 。 它 可 以 进一步 扩充 ， 到 达 节 点 C。 
此 时 产 30，cp=0。 从 C 点 能 够 移动 到 FE 或 G。 假 定 移动 到 FE。F 变 为 新 的 E- 节 点 ， 活 动 节 
点 为 A、C、F。, 在 F 点 , r=15，cp=25。 从 下 点 能 移动 到 或 M。 假定 移动 到 L。 此 时 +x=0， 
cp=50。 既 然 工 是 一 个 叶 节点 ， 而 且 它 代表 了 一 个 比 目 前 最 优 解 〈( 即 在 节点 K 的 解 ) 更 好 的 
可 行 解 ,我 们 把 这 个 解 作 为 最 优 解 。 节 点 工 死 亡 ， 我 们 回溯 到 节点 FE。 这 样 继续 下 去 ， 搜 索 
整 棵 树 。 在 搜索 期 间 发 现 的 最 好 解 即 为 最 优 解 。 国 

例 20-3[ 旅行 商 问题 ] 给 定 一 个 顶点 网 络 (有 向 或 无 向 )， 找 出 一 个 包含 nn 个 顶点 旦 
具有 最 小 耗费 的 环 路 。 任 何 一 个 包含 网 络 所 有 个 顶点 的 环 路 称 为 一 个 旅行 (tour )。 旅 行商 
问题 是 要 寻找 一 条 耗费 最 少 的 旅行 。 


图 20-4 是 一 个 四 顶点 无 向 网 络 。 这 个 网 络 有 一 些 旅行 : 1,2,4,3,1 ; 1,3,2,4,1 和 1,4,3,2,1。 
旅行 2,4,3,1,2 ; 4,3,1,2,4 和 3,1,2,4,3 与 旅行 1,2,4,3,1 一 样 。 而 旅行 1,3,4,2,1 ”30 


) 


与 旅行 1,2,4,3,1 相反 。 旅 行 1,2,4,3,1 的 耗费 为 66 ; 旅行 1,3,2,4,1 的 耗费 为 “ 

25; 旅行 1,4,3,2,1 的 耗费 为 59。 故 1,3,2,4,1 是 该 网 络 中 耗费 最 少 的 旅行 。 6 X10 
顾名思义 ,旅行 商 问题 可 用 来 模拟 旅行 商 的 经 营区 域 。 顶 点 表示 城市 。 | / | 

(包括 起 点 )。 边 上 的 权 表 示 在 两 个 城市 间 所 需要 的 旅行 时 间 (或 花费 )。 B70 一 9 

0 7 

旅行 商 问题 还 可 以 用 来 模拟 其 他 问题 。 假 定 在 一 个 金属 板 或 印刷 电路 板 上 用 一 个 机 器 外 
头 来 钻 一 些 孔 。 孔 的 位 置 已 知 。 机 器 钻头 从 起 始 位 置 开 始 ， 移 动 到 每 一 个 钻 孔 位 置 钻 孔 ， 然 
后 回 到 起 始 位 置 。 总 时 间 是 外 所 有 和 孔 的 时 间 与 钻头 移动 的 时 间 。 外 所 有 和 孔 的 时 间 独 立 于 铬 孔 
顺序 。 然 而 ， 钴 头 移动 时 间 是 钴 头 旅行 距离 的 函数 。 因 此 ， 希 望 找到 距离 最 短 的 旅行 。 

另 一 个 例子 是 批量 生产 ， 其 中 一 台 机 器 可 用 来 批量 生产 n 个 不 同 的 产品 。 利 用 一 个 生产 
循环 过 程 ， 这 些 产 品 可 以 不 断 地 批量 生产 。 在 一 个 生产 循环 中 ， 所 有 n 个 产品 按 顺 序 生产 出 
来 ,然后 进行 下 一 个 生产 循环 。 在 下 一 个 生产 循环 中 ， 生 产 顺 序 不 变 。 例 如 ， 如 果 这 台 机 器 
是 顺序 地 为 红色 、 白 色 和 蓝 色 小 汽车 喷漆 ， 那 么 在 为 蓝 色 小 汽车 喷漆 之 后 ， 我 们 又 开始 了 新 
一 轮 循 环 。 一 个 循环 的 花费 包括 生产 一 个 循环 中 的 产品 所 需 的 花费 以 及 从 一 个 产品 转变 到 另 
一 个 产品 的 花费 。 虽 然 生产 产 品 的 花费 独立 于 生产 顺序 ， 但 从 一 个 产品 转变 到 另 一 个 产品 的 
花费 却 与 生产 顺序 有 关 。 为 了 使 花费 最 小 ， 可 以 定义 一 个 有 向 图 ， 顶 点 表示 产品 ， 边 (i,j) 上 
的 值 是 从 产品 i 转变 到 产品 j 所 需 的 花费 。 一 个 耗费 最 小 的 旅行 是 一 个 耗费 最 小 的 生产 循环 。 






| 


既然 旅行 是 包含 所 有 顶点 的 一 个 循环 ， 那 么 可 以 把 任意 一 个 顶点 作为 起 点 ( 因此 也 是 终 
点 ) 我 们 任意 选取 顶点 1 作为 起 点 和 终点 。 于 是 每 一 个 旅行 可 用 顶点 序列 1,v2…,v,l 来 描 


述 ， 其 中 ww 是 (2,3…,n) 的 一 个 排列 。 可 能 的 旅行 可 用 一 棵 树 来 描述 ， 其 中 每 一 个 从 根 
到 叶 的 路 径 定义 了 一 个 旅行 。 图 20-5 是 一 棵 表示 四 顶点 网 络 的 树 。 从 根 到 叶 的 路 径 中 ， 边 上 
的 标号 定义 了 一 个 旅行 (还 要 附加 1 作为 终点 )。 例 如 ， 到 节点 工 的 路 径 表 示 旅 行 1,2,3,4,1， 
而 到 节点 O 的 路 径 表 示 旅 行 1,3,4,2,1。 网 络 中 的 每 一 个 旅行 都 正好 由 树 中 的 一 条 根 到 叶 的 路 
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径 来 表示 - 因此 ， 树 中 叶子 的 数目 为 (n-D)!。 
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图 20-5 四 顶点 网 络 的 解 空 间 树 


回溯 算法 ， 从 搜索 解 空 间 树 的 根 开始 ， 按 深度 优先 方式 寻找 耗费 最 小 的 旅行 。 利 用 图 
20-5 的 解 空 间 树 ， 一 个 可 能 的 搜索 为 ABCFL。 在 工 点 ， 旅 行 1,2,3,4,1 作为 当前 最 佳 旅 行 被 
记录 下 来 。 旅 行 耗费 是 59。 从 工 点 回溯 到 活动 节点 F。 由 于 F 没有 未 检查 的 孩子 ， 所 以 它 成 
为 死 节点 ， 我 们 回潮 到 C 点 。C 变 为 E- 节 点 ， 从 C 点 向 前 移动 到 G， 然 后 是 M。 这 样 构造 出 
旅行 1,2,4,3,1， 耗 费 是 66。 既 然 它 不 比 当前 的 最 佳 旅行 好 ， 抛 弃 这 个 旅行 并 回溯 到 G， 然 后 
是 C，B。 从 B 点 向 前 移动 到 D， 然 后 是 吾 ，N。 这 个 旅行 是 1.3,2,4,1， 耗 费 25， 比 当前 的 最 
佳 旅 行 好 ， 把 它 作为 当前 最 佳 旅 行 。 从 N 点 回潮 到 卫 ， 然 后 是 D。 从 D 点 向 前 移动 ， 到 达 0 
点 。 如 此 继续 下 去 ， 搜 索 完 整 棵 树 ， 得 到 耗费 最 少 的 旅行 是 1,3,2,4,1。 图 

当 问 题 需要 n 个 元 素 的 一 个 子 集 来 优化 函数 时 ， 解 空间 树 称 为 子 集 树 (subset tree)。 对 n 
个 对 象 的 0/1 背包 问题 来 说 ， 解 空间 树 便 是 一 个 子 集 树 。 这 样 一 棵 树 有 2” 个 叶 节 点 ， 全 部 节 
点 有 2” -1 个 。 因 此, 访问 树 中 所 有 节点 的 每 一 个 算法 都 要 耗 时 Q(2")。 当 问题 需要 n 个 元 素 
的 一 个 排列 来 优化 函数 时 ， 解 空间 树 称 为 排列 树 (permutation tree)。 这 样 的 树 有 nn! 个 叶 节 
点 。 遍 历 树 中 所 有 节点 的 每 一 个 算法 都 要 耗 时 Q(n!)。 图 20-5 的 树 便 是 ， 寻 找 顶 点 {2,3,4} 的 
最 佳 排列 时 的 树 。 顶 点 1 是 旅行 的 起 点 和 终点 。 

确定 一 个 新 到 达 的 节点 能 否 导致 一 个 比 当 前 最 优 解 还 要 好 的 解 ， 可 加 速 对 最 优 解 的 搜索 
过 程 。 如 果 不 能 ， 则 移动 到 该 节点 的 任何 一 棵 子 树 都 是 无 意义 的 。 这 个 节点 可 被 立即 杀 死 。 
用 来 杀 死 活动 节点 的 策略 称 为 界定 函数 ( bounding function)。 在 例 20-2 中 ， 我 们 使 用 了 如 
下 界定 函数 : 杀 死 那些 代表 不 可 行 解 的 节点 。 对 于 旅行 商 问题 ， 可 使 用 这 样 的 界定 函数 : 如 
果 到 达 当 前 节点 的 一 段 旅行 的 耗费 不 少 于 当前 最 佳 路 径 的 耗费 ， 则 杀 死 当前 节点 。 如 果 在 图 
20-4 的 例子 中 使 用 该 界定 函数 ， 那 么 当 达 到 图 20-5 的 节点 I 时 ,已 经 找到 了 具有 耗费 25 的 
1,3,2,4,1 的 旅行 。 而 到 达 节 点 I 的 一 段 旅行 (1,3,4) 的 耗费 为 26。 若 继续 这 有 段 旅行 ， 则 不 会 得 
到 一 个 耗费 小 于 25 的 结果 。 因 此 ， 搜 索 以 I 为 根 节点 的 子 树 毫 无 意义 。 


小 结 


回溯 方法 的 步 又 如 下 : 

1 ) 定义 一 个 解 空间 ， 它 包含 对 问题 实例 的 解 。 

2 ) 用 适合 于 搜索 的 方式 组 织 解 空 间 。 

3 ) 用 深度 优先 方式 搜索 解 空间 ， 利 用 界定 函数 避免 进入 无 解 的 子 空间 。 

回溯 算法 的 实现 有 一 个 有 意义 的 特性 : 在 进行 搜索 的 同时 产生 解 空间 。 在 搜索 过 程 的 任 








何 时 刻 ， 仅 保留 从 开始 节点 到 当前 E- 节 点 的 路 径 。 因 此 ， 回 漳 算 法 的 空间 需求 为 O( 从 开始 
节点 起 最 长 路 径 的 长 度 )。 这 个 特性 非常 重要 ， 因 为 解 空间 的 大 小 通常 是 最 长 路 径 长 度 的 指数 
或 阶乘 。 所 以 如 果 要 存储 全 部 解 空间 ， 那 么 再 多 的 空间 也 不 够 用 。 


练习 


1. 考察 如 下 0/1 背包 问题 : n=4，w=[20,25,15,35]，p=[40,49,25,60]，c=62。 
1 ) 画 出 该 0/1 背包 问题 的 解 空间 树 。 
2 ) 对 该 树 运用 回溯 算法 ( 利用 m、ws 和 ec 的 值 )。 依 回 淹 算 法 的 遍历 顺序 标记 节点 。 确 定 
回溯 算法 未 裔 历 的 节点 。 
2. 如 题 : 
1 ) 当 m=5s 时 ， 画 出 旅行 商 问题 的 解 空 间 树 。 
2 ) 在 该 树 上 ， 运 用 回溯 算法 ( 使 用 图 20-6 的 实例 )。 依 回溯 算 
法 的 遍历 顺序 标记 节点 。 确 定 未 遍历 的 节点 。 

3. 每 周 六 Mary 和 Joe 都 在 一 起 打 乒 乓 球 。 她 们 每 人 都 有 一 个 篮 
子 ， 每 个 篮子 装着 120 个 球 。 一 直 打下 去 ， 直 到 两 个 链子 为 空 。 ”图 20-6 练习 2 的 实例 
然后 她 们 需要 拾 起 240 个 球 ， 装 满 各 自 的 篮子 ， 然 后 把 篮子 放 回 原 处 。 以 网 为 界 ，Mary 只 
拾 她 这 边 的 球 ， 而 Joe 拾 剩 下 的 球 。 如 何 用 旅行 商 问题 帮助 Mary 和 Joe 决定 拾 球 的 顺序 以 
便 她 们 走 最 少 的 路 。 





20.2 应 用 
20.2.1 货 箱 装载 

1. 问题 描述 

17.3.1 节 考 察 的 问题 是 ， 用 最 大 数量 的 货 箱 装 船 。 现 在 该 问题 有 一 些 改动 : 有 两 笨 船 ， n 
个 货 箱 。 第 一 盘 船 的 载重 量 是 c,， 第 二 艘 船 的 载重 量 是 c2。w; 是 货 箱 i 的 重量 目 >w Sato, 
我 们 希望 确定 是 否 有 一 种 办 法 可 以 把 n 个 货 箱 全 部 装 上 船 。 如 果 有 ， 找 出 这 种 方法 。 

例 20-4 车 n=3，c1=c2=50，w=[10,40,40]， 则 可 将 货 箱 1、2 装 到 第 一 艘 船上 ， 货 箱 3 
装 到 第 二 艘 船上 。 如 果 w=[20,40,40]， 则 无 法 将 货 箱 全 部 装 船 。 国 

Pw = ci+c; 时 ， 两 稻 船 的 装载 问题 等 价 于 子 集 之 和 ( sum-of-subset ) 问题 ， 即 及 个 
数字 ， 要 求 找到 一 个 子 集 ( 如 果 存在 的 话 )， 使 它 的 和 为 ci crses Dw=20 时 ， 两 起 
船 的 装载 问题 等 价 于 分 割 问 题 ( partition problem )， 即 有 nn 个 数字 4a;, (1 < i < n)， 要 求 找 
到 一 个 子 集 ( 如 果 存 在 的 话 )， 使 4 和子 集 之 和 为 (>a )2。 分 割 问题 和 子 集 之 和 问题 都 是 NP- 
复杂 问题 。 而 且 即 使 问题 被 限制 为 整数 ， 它 们 仍 是 NP- 复杂 问题 。 所 以 不 能 期 望 在 多 项 式 时 
间 内 解决 两 艘 船 的 装载 问题 。 

只 要 有 一 种 方法 能 够 把 所 有 n 个 货 箱 都 装 上 船 ， 就 可 以 验证 以 下 的 装 船 策略 行 之 有 效 : 
1 ) 尽 可 能 将 第 一 稻 船 装载 到 它 的 载重 量 极限 ; 2 ) 将 剩余 货 箱 装 到 第 二 艘 船 。 为 了 尽 可 能 地 
将 第 一 稻 船 装 满 ， 需 要 选择 一 个 货 箱 的 子 集 ， 它 们 的 总 重量 尽 可 能 接近 于 c1。 这 个 选择 可 通 
过 0/1 背包 问题 来 解决 
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maxy， WX 
限制 条 件 是 
Dw <a XE{01},1l<ig<n 

当 重量 是 整数 时 ， 可 用 19.2.1 节 的 动态 规划 方法 确定 第 一 艘 船 的 最 佳 装载 。 用 元 组 方法 
所 需 的 时 间 为 O(min{c1,2”)。 可 以 使 用 回潮 方法 设计 一 个 复杂 度 为 0(2”) 的 算法 ， 在 有 些 实 
例 中 ， 它 比 动态 规划 算法 要 好 

2. 第 一 种 回溯 算法 

既然 要 找 一 个 重量 的 子 集 ， 使 子 集 之 和 尽量 接近 c1， 那 么 可 以 使 用 一 个 子 集 空 间 ， 并 
将 其 组 织 成 如 图 20-2 所 示 的 二 义 树 。 用 深度 优先 方式 搜索 子 空间 以 求 最 优 解 。 用 界定 也 
数 防止 无 解 节点 的 扩张 。 如 果 Z 是 树 中 j+1 层 的 一 个 节点 ,那么 从 根 到 Zz 的 路 径 便 定义 了 
xl i<j 的 值 。 使 用 这 些 值 定义 cw ( 当前 重量 ) 为 六 wx 。 若 cw>ci， 则 以 Z 为 根 的 子 


树 不 包含 可 行 解 。 可 用 这 个 检验 作为 界定 图 数 。( 我 们 可 以 增加 一 个 检验 ， 判 断 等 式 cw=c1 是 
否 成 立 。 如 果 成 立 ， 就 可 以 停止 搜索 。 不 过 我 们 不 增加 这 样 的 检验 。) 一 个 节点 是 不 可 行 的 ， 
当 且 仅 当 它 的 cw 值 大 于 ci。 

例 20-5 假定 n=4，w=[8,6,2,3]，c1=12。 解 空间 树 为 图 20-2 的 树 再 加 上 一 层 节 点 。 搜 
索 从 根 A 开始 且 cw=0。 若 移动 到 左 孩 子 B， 则 cw=8，cw < c1=12。 以 B 为 根 的 子 树 包含 一 
个 可 行 的 节点 ， 故 移动 到 节点 B。 从 节点 B 不 能 移动 到 节点 D， 因 为 ew+w2>c1 ; 因此 在 这 棵 
子 树 中 ,没有 树叶 代表 可 行 的 解 。 直 接 移动 到 节点 EE， 这 个 移动 未 改变 cw。 下 一 步 为 节点 J， 
这 时 cw=10。 的 左 孩 子 的 cw 值 为 13， 超 出 了 ci1， 故 搜索 不 能 移动 到 了 的 左 孩 子 。 可 移动 到 
J 的 右 孩 子 ， 它 是 一 个 叶 节 点 。 至 此 ,已 找到 了 一 个 子 集 ， 它 的 cw=10。xi 的 值 由 从 A 到 J 了 的 
右 孩 子 的 路 径 获得 。 这 些 x; 值 为 [1,0,1,0]。 

回 漳 算 法 现在 回溯 到 J， 然 后 是 E。 从 E， 再 次 沿 着 树 向 下 移动 到 节点 KK， 此 时 cw=8。 
移动 到 它 的 左 子 树 ， 有 cw=11。 既 然 已 到 达 了 一 个 叶 节 点 ， 就 检查 cw 的 值 是 否 大 于 当前 的 最 
优 cw 的 值 。 结 果 确 实 大 于 最 优 值 ， 所 以 这 个 叶 节 点 表示 了 一 个 比 [1,0,1,0] 更 好 的 解决 方案 。 
到 该 节点 的 路 径 决定 了 zx 的 值 [1,0,0,1]。 

从 这 个 叶 节 点 回溯 到 节点 K， 现 在 可 以 移动 到 的 有 孩子， 它 是 一 个 叶 节 点 ， 其 cw=8。 
这 个 值 不 比 当 前 最 优 的 ew 值 更 好 ， 所 以 我 们 回潮 到 玉 、E、B， 直 到 A。 从 根 节点 开始 ， 沿 
树 继 续 向 下 移动 。 算 法 将 移动 到 C 并 搜索 它 的 子 树 。 加 

使 用 前 述 的 界定 函数 得 到 程序 20-1 中 的 回溯 算法 。 这 个 算法 使 用 了 全 局 变量 numberOf 
Containers 、weight、capacity 、weightOfCurrentLoading 和 maxWeightSoFar。 货 箱 重 量 为 weight 
[1: numberOfContainers]。 调 用 rLoad(1)， 返 回 < capacity 的 最 大 子 集 之 和 ， 但 它 不 能 找到 这 
个 最 大 子 集 。 后 面 将 改进 这 个 代码 以 便 找 到 这 个 子 集 。 


程序 20-1 ”第 一 种 回溯 算法 
void rLoad (int currentLevel) 
{// 从 currentLevel 处 的 节点 开始 搜索 
if (currentLevel > numberOfContainers) 
{W/ 在 一 个 叶 节 点 
if (weightOfCurrentLoading> maxWeightSoFar) 
maxWeightSoFar = weightOfCurrentLoading; 
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return; 

} 

// 不 在 一 个 叶 节 点 ， 检 查 子 树 

if (weightOfCurrentLoading + weight[currentLevel] <= capacity) 

{// 搜索 左 子 树 ; 即 x[currentLevel]=1 
weightOfCurrentLoading += weight [currentLevel]; 
rLoad(currentLevel + 1); 
weightOfCurrentLoading -= weight [currentLevel]; 

} 

rLoad (currentLevel+1); // 搜索 右 子 树 

} 


rLoad(currentLevel) 从 currentLevel 层 中 一 个 隐 式 确定 的 节点 开始 ， 搜 索 以 该 节点 为 根 的 子 
树 。 若 currentLevel>numberOfContainers， 则 已 到 达 一 个 叶 节 点 。 由 这 个 叶 节 点 定义 的 解 有 重量 
weightOfCurrentLoading， 它 一 定 志 capacity， 因 为 搜索 不 会 移动 到 不 可 行 的 节点 。 若 weightOf- 
CurrentLoading>maxWeightSoFar， 则 更 新 当前 最 优 解 的 值 。 当 currentLevel < numberOfContainers 
时 ， 我 们 到 达 有 两 个 孩子 的 节点 Z。 左 孩子 表示 x[currentLevel]=1 的 情况 ， 只 有 weight- 
OfCurrentLoading+weight[currentLevel] 三 capacity， 才 能 移 到 这 里 。 当 移动 到 左 孩 子 时， 
weightOfCurrentLoading 增加 weight[currentLevell， 并 且 到 达 一 个 curentLevel+l 层 的 节点 。 递 
归 搜 索 以 该 节点 为 根 的 子 树 。 搜 索 完 成 后 ， 回 到 节点 Z。 为 了 得 到 ZZ 的 weightOfCurrentLoading 
值 ， 需 用 当前 的 weightOfCurrentLoading 值 减 去 weight[currentLevel]。Z 的 右 子 树 还 未 搜索 。 既 
然 这 个 子 树 表示 x[currentLevel]=0 的 情况 ， 所 以 无 需 进行 可 行 性 检查 就 可 移动 到 该 子 树 ， 因 为 
一 个 可 行 节点 的 右 孩 子 总 是 可 行 的 。 

注意 , 函数 rLoad 没有 明确 建立 解 空间 树 。rLoad 在 其 到 达 的 每 一 个 节点 上 花费 6(1) 时 
间 。 到 达 的 节点 数量 为 0(2")， 所 以 复杂 度 为 0(2")。 这 个 也 数 使 用 的 递归 栈 空 间 为 6(n)。 

3. 第 二 种 回溯 方法 

有 些 右 子 树 不 可 能 包含 比 当 前 最 优 解 更 好 的 解 ， 我 们 不 要 移动 到 这 种 右 子 树 中 去 ， 以 此 
提高 函数 rLoad 的 性 能 。 今 Z 为 解 空间 树 第 i 层 的 一 个 节点 。 以 Z 为 根 的 子 树 中 没有 叶 节 点 
的 重量 超过 weightOfCurrentLoading+remainingWeight， 其 中 remainingWeight= yweight[ a 


为 剩余 货 箱 的 重量 (n 是 货 箱 数 量 )。 因 此 ， 当 
weightOfCurrentLoading+remaining Weight < maxWeightSoFar 


没有 必要 去 搜索 Z 的 右 子 树 。 

例 20-6 令 n、w、ci 的 值 与 例 20-5 中 的 相同 。 用 新 的 界定 函数 ， 搜 索 至 第 一 个 叶 
节点 ( 它 是 J 的 右 孩 子 ) maxWeightSoFar 置 为 10; 回溯 到 E， 然 后 向 下 移动 到 K 的 左 
孩子 ， 此 时 maxWeightSoFar 更 新 为 11。 我 们 没有 移动 到 的 右 孩 子 ， 因 为 在 右 孩 子 节 
点 weightOfCurrentLoading=8，remainingWeight=0，weightOfCurrentLoading+remaining- 
Weight 三 maxWeightSoFar。 回 溯 到 节点 A。 同 样 ， 我 们 不 必 移 动 到 右 孩 子 C， 因 为 在 C 点 
weightOfCurrentLoading=0，remainingWeight=11l BH weightOfCurrentLoading+remaining Weight 
< maxWeightSoFar。 

加 强 了 条 件 的 界定 函数 避免 了 对 A 的 右 子 树 和 KK 的 右 子 树 的 搜索 。 国 

使 用 加 强 版 的 界定 函数 ， 得 到 程序 20-2 的 代码 。 这 个 代码 增加 了 全 局 变量 
remainingWeight， 它 的 初 值 是 货 箱 重量 之 和 。 新 的 代码 没有 检查 一 个 到 达 的 叶 节 点 是 否 具 有 
比 当 前 最 优 解 还 多 的 重量 。 这 样 的 检查 是 不 必要 的 ， 因 为 加 强 版 的 界定 函数 只 允许 移动 到 能 
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够 产生 更 优 解 的 节点 。 因 此 ， 每 到 达 一 个 新 的 叶 节 点 都 意味 着 找到 了 比 当前 最 优 解 还 优 的 解 。 
昌 然 新 代码 的 复杂 度 仍 是 0(2")， 但 它 搜索 的 节点 比 程序 20-1 的 要 少 。 


程序 20-2 程序 20-1 的 细 化 


void rLoad(int currentLevel) 
11/ 从 currentLevel 处 的 节点 开始 搜索 
if (currentLevel > numberOfContainers) 
{1/ 在 一 个 叶 节 点 
maxWeightSoFar = weightOfCurrentLoading; 
return? 


// 不 在 一 个 叶 节点， 检查 子 树 
remainingWeight -= weight [currentLevel]; 
if (weightOfCurrentLoading + weight[lcurrentLevel] <= capacity) 
{1/ 搜索 左 子 树 
weightOfCurrentLoading += weight [currentLevell]; 
rLoad (currentLevel + 1); 
weightOfCurrentLoading -= weight[currentLevell]; 
} 
if (weightOfCurrentLoading + remainingWeight > maxWeightSorFar) 
1/ 搜索 右 子 树 
rLoad(currentLevel+1); 
remainingWeight += weight [currentLevel]; 


4. 寻找 最 优 子 集 

为 了 确定 重量 最 接近 capacity 的 货 箱子 集 ， 有 必要 增加 代码 来 记录 当前 找到 的 最 优 子 集 。 
为 此 ， 使 用 一 维 数组 bestLoadingSoFar。 当 有 日 仅 当 bestLoadingSoFar[i]=1 时 ， 货 箱 i 属 于 最 优 
子 集 。 新 代码 见 程序 20-3 和 程序 20-4。 


程序 20-3 ”报告 最 优 装载 的 预 处 理 程序 


int maxLoading (int *theWeight, int theNumberOfContainers, 
int theCapacity, int *bestLoading) 
{/ 数组 theweight[1:theNumberOfContainers] 是 货 箱 重量 
1/theCapacity 是 船 的 装载 量 
// 数 组 bestLoading[1:theNumberOfContainers] 是 解 
/返回 最 大 装载 重量 
1/ 初始 化 全 局 变量 
numberOfContainers = theNumberOfContainers; 
weight = theWeight; 
capacity = theCapacity; 
weightofCurrentLoading = 0; 
maxWeightSoFar = 0; 
CurrentLoading = new int [numberOfContainers + 1]; 
bestLoadingSoFar = bestLoading; 


1/ remainingWeight 的 初始 值 是 所 有 货 箱 重 量 之 和 
for (int i = 1; i <= numberOfContainers; i++) 
remainingWeight += weight [i]; 


/ 计算 最 优 装载 的 重量 
rLoad(1); 
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return maxWeightSoFar; 


程序 20-4 ”报告 最 优 装 载 的 回溯 算法 
void rLoad (int currentLevel) 
{/ 从 currentLevel 处 的 节点 开始 搜索 
if (currentLevel > numberOfContainers) 
{// 到 达 一 个 叶 节 上 点， 存储 更 优 的 解 


for (int j = 1;»; ] <= numberOfContainers; j++) 





bestLoadingSoFar[j] = currentLoading([j]; 
maxWeightSoFar = weightOfCurrentLoading; 
return; 


} 


/ 没有 到 达 一 个 叶 节 点 ， 检 查 子 树 


remainingWeight -= weight[currentLevel]; 
if (weightofCurrentLoading + weight [currentLevel] <= capacity) 
{V/ 搜索 左 子 树 

currentLoading[currentLevel] = 1; 


weightOfCurrentLoading += weight[currentLevel]; 
rLoad (currentLevel + 1); 
weightOfCurrentLoading -= weight [currentLevel]; 

} 

if (weightOfCurrentLoading + remainingWeight > maxWeightSoFar) 

{ 
currentLoading[currentLevel] = 0; 1/ 搜索 右 子 树 
rLoad (currentLevel + 1); 

} 

remainingWeight += weight [currentLevel]; 

} 





这 段 代码 增加 了 两 个 全 局 变量 : currentLoading 和 bestLoadingSoFar。 这 两 个 变量 都 是 整 
型 一 维 数组 ( 也 可 以 用 布尔 型 )。 数 组 currentLoading 用 来 记录 从 搜索 树 的 根 到 当前 节点 的 路 
径 ( 即 它 保留 路 径 上 的 x; 值 )，bestLoadingSoFar 记录 当前 最 优 解 。 只 要 到 达 一 个 具有 和 较 优 解 
的 叶 节 点 ， 就 更 新 bestLoadingSoFar 以 表示 从 根 到 这 个 叶 节 点 的 路 径 。 路 径 中 的 1 确定 了 要 
装载 的 货 箱 。 数 组 currentLoading 空间 由 maxLoading 分 配 。 

因为 bestLoadingSoFar 要 更 新 O(29 次 ， 所 以 rLoad 的 复杂 度 为 O(n2")。 使 用 下 列 方法 之 
一 ， 复 杂 度 可 降 为 0(2”): 

1 ) 首先 运行 程序 20-2 的 代码 ， 以 确定 最 优 装 载 的 重量 。 令 这 个 重量 为 maxWeight。 然 
后 运行 改进 程序 20-3 和 程序 20-4。 改 进 后 的 程序 从 maxWeightSoFar=maxWeight 开始 ， 只 要 
weightOfCurrentLoading+remainingWeight maxWeightSoFar， 就 搜索 右 子 树 ， 而 且 在 第 一 次 
到 达 一 个 叶 节 点 时 终止 ( 即 currentLevel>numberOfContainers )。 

2) 修改 程序 20-4 的 代码 ， 以 不 断 保留 从 根 到 当前 最 优 叶 节点 的 路 径 。 尤 其 到 
达 i 层 节点 时 ， 到 最 优 叶 节点 的 路 径 由 currentLoading[j](1 < j<i) 和 bestLoadingSoFar[j] 
0 二 i numberOfContainers) 给 出 。 按 照 这 种 方法 ,算法 每 次 回溯 一 层级 ， 一 个 x; 便 存储 在 
bestLoadingSoFar。 由 于 算法 回溯 的 次 数 是 0(2")， 所 以 额外 开销 为 0(2")。 

5. 一 个 改进 的 迭代 版 本 

可 改进 程序 20-3 和 程序 20-4 以 减少 它们 的 空间 需求 。 因 为 数组 currentLoading 中 存储 着 
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可 在 树 中 移动 的 信息 ， 所 以 可 以 取消 大 小 为 9(n) 的 递归 栈 空间 。 如 例 20-5 所 示 ， 从 解 空间 树 
的 任何 一 个 节点 ， 算 法 不 断 向 左 孩 子 移动 ， 直 到 不 能 再 移动 为 止 。 如 果 到 达 一 个 叶 节 点 ， 则 更 
新 最 优 解 。 否 则 ， 查 看 是 否 可 以 移动 到 右 孩 子 。 如 果 到 达 一 个 叶 节 点 ,或 者 不 能 移动 到 一 个 右 
孩子 ,算法 就 回溯 到 一 个 节点 ， 从 这 个 节点 可 以 向 其 右 孩 子 移动 且 有 可 能 找到 最 优 解 。 这 个 节 
点 有 一 个 特性 : 它 是 路 径 上 具有 currentLoading[i]=1 的 节点 中 离 根 节点 最 近 的 节点 。 如 果 向 右 
孩子 移动 是 可 能 有 结果 的 ， 那 就 移动 到 右 孩 子 ， 然 后 再 进行 一 系列 向 左 孩 子 的 移动 。 如 果 向 右 
孩子 的 移动 是 无 效 的 ， 则 回溯 到 currentLoading[i]=1 的 下 一 个 节点 。 程 序 20-5 是 这 种 遍历 算法 
的 迭代 形式 ( 即 循 环形 式 )。 和 递归 算法 不 同 ， 和 迭代 算法 先 移动 到 右 孩 子 ， 再 检查 是 否 该 向 右 
孩子 移动 。 如 果 不 能 移动 ， 则 回 湖 。 和 迭代 的 时 间 复 杂 度 与 程序 20-3 和 程序 20-4 一 样 。 


程序 20-5 ”装载 问题 的 迭代 算法 
int maxLoading(int *weight, int numberOfContainers, int capacity, 
int *bestLoading) 

{1/ 数组 weight[l1:numberOfCcontainers] 是 货 箱 的 重量 
/ capacity 是 船 的 装载 量 
1// 数 组 bestLoading[1:numberOfContainers] 是 解 
/返回 最 大 装载 的 重量 . 

1/ 初始 化 根 

int currentLevel = 1; 

int *currentLoading = new int [numberOfContainers + 1]; 

/数组 currentLoading[1:1i-1] 是 到 达 当 前 节点 的 路 径 

int maxWeightSoFar = 0; 

int weightOfCurrentLoading = 0; 

int remainingWeight = 0; 

for (int ] = 1; j <= numberOfContainers; j++) 

remainingWeight += weight[j]; 


/ 对 树 进 行 搜索 
while (true) 
{1/ 尽 可 能 沿 左 分 支 移动 
While (currentLevel <= numberOfContainers && 
weightOfCurrentLoading + weight[currentLevel] <= capacity) 
{// 移 到 左 孩 子 : 
remainingWeight -= weight [currentLevel]; 
weightOfCurrentLoading += weight[currentLevell]; 
CurrentLoading[currentLevel] = 1; 
currentLevel++; 


} 


if (currentLevel > numberOfContainers) 


{W 到达 叶 节点 
for (int jj = 1; 了 <= numberOfContainers; j++) 
bestLoading[j] = currentLoading[j]; 


maxWeightSoFar = weightOofCurrentLoading; 
} 


else 

{// 移 到 右 孩 子 
remainingWeight -= weightilcurrentLevell]; 
currentLoading[currentLevel] = 0; 


currentLeveltt+; 
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// 需要 时 回 湖 
while (weightOfCurrentLoading + remainingWeight <= maxWweightSoFar) 
{/ 这 棵 子 树 没有 更 好 的 叶 节 点 ， 回 泪 
currentLevel--;} 
while (currentLevel > 0 && currentLoading[currentLevel] == 0) 
{1/ 从 一 个 右 孩 子 回 淹 
remainingWeight += weight[currentLevell]; 
currentLevel--—;} 
} 


if (currentLevel == 0) 
return maxWeightSorFar; 


1/ 移 到 右 子 树 
currentLoading[currentLevel] = 0; 
weightOfCurrentLoading -= weight [currentLevell]; 


currentLevel++; 


20.2.2 0/1 背包 问题 


”1. 回溯 求解 

0/1 背包 问题 是 一 个 NP- 复杂 问题 ， 为 了 解决 该 问题 ， 我 们 采用 了 17.3.2 节 的 贪 禁 启 发 
算法 和 19.2.1 节 的 动态 规划 算法 。 在 本 节 ， 我 们 要 用 回溯 算法 。 既 然 要 选择 一 个 对 象 的 子 集 ， 
将 它们 装 人 背包 ， 以 便 获 得 最 大 的 收益 ， 解 空间 就 应 该 组 织 成 子 集 树 结 构 ( 如 图 20-2 所 示 )。 
0/1 背包 问题 的 回 淹 算 法 与 20.2.1 节 的 装载 问题 的 回 湖 算 法 很 类 似 。 首 先 形成 一 个 递归 算法 ， 
寻找 可 获得 的 最 大 收益 。 然 后 把 该 算法 细 化 成 代码 ， 找 到 可 以 装 人 背包 、 含 有 最 大 收益 的 对 
象 集合 。 

与 程序 20-2 的 情况 一 样 ， 只 要 左 孩子 表示 一 个 可 行 的 节点 ， 就 沿 着 左 分 支 移动 ;否则 ， 
当 右 子 树 可 能 含有 优 于 当前 最 优 解 的 解 时 ， 搜 索 右 孩子 。 是 否 要 搜索 右 子 树 ， 一 个 简单 的 判 
定 方法 是 ， 当 前 节点 的 收益 加 上 还 未 考察 的 对 象 的 收益 是 否 超过 当前 最 优 解 的 收益 。 如 果 不 
是 ， 则 不 需要 搜索 右 子 树 。 一 种 更 有 效 的 方法 是 按 收益 密度 (pi/wi) 对 剩余 对 象 排列 ， 将 对 
象 按 密度 递减 的 顺序 填充 背包 的 剩余 容量 ， 当 遇 到 第 一 个 不 能 全 部 放 人 背包 的 对 象 时 ， 就 使 
用 它 的 一 部 分 。 

例 20-7 考察 一 个 背包 装载 实例 : n=4，c=7，p=[9,10,7,4]，w=[3,5,2,1]。 对 象 的 收益 密 
度 为 [3,2,3.5,4]。 当 以 密度 递减 顺序 装 包 时 ， 首 先 选择 对 象 4， 然 后 是 对 象 3、 对 象 1。 在 把 
这 三 个 对 象 装 和 人 背包 后 ， 剩 余 容 量 为 1。 这 个 容量 可 容纳 对 象 2 的 0.2 的 重量 ， 可 产生 的 收益 
为 2。 生 成 的 解 为 x=[1,0.2,1,1]， 相 应 的 收益 为 22。 尽 管 该 解 不 可 行 (x; 是 0.2， 而 实际 应 为 0 
或 1 ), 但 它 的 收益 22 一 定 不 少 于 可 行 的 最 优 解 。 因 此 我 们 得 知 ， 该 0/1 背包 问题 没有 收益 多 
于 22 的 解 。 

解 空间 树 为 图 20-2 再 加 上 一 层 节 点 。 当 位 于 解 空间 树 的 节点 B 时 ，xri=1， 收 益 为 
cp=9。 该 节点 所 用 容量 为 cw=3。 为 获得 最 好 的 附加 收益 ， 要 以 密度 递减 的 顺序 填充 剩余 容量 
clejfi=c-cw=4。 也 就 是 说 ， 先 把 对 象 4 装 包 ， 然 后 是 对 象 3， 然 后 是 对 象 2 的 0.2 倍 的 重量 。 
因此 ， 子 树 A 的 最 优 解 的 收益 至 多 为 22. 





党 20 间 回 六 法 3513 





当 位 于 节点 C 时 ，cp=cw=0，clej=c=7。 按 密度 递减 顺序 填充 剩余 容量 ， 先 把 对 象 4 和 3 
装 人 背包 。 然 后 把 对 象 2 的 0.8 倍 装 人 背包 。 这 样 产生 的 收益 为 19。 在 子 树 C 中 没有 节点 可 
产生 出 更 大 的 收益 。 

在 节点 E，cp=9，cw=3，cleji=4。 仅 剩 对 象 3 和 4 需要 考虑 。 按 密度 递减 顺序 考虑 ， 先 
把 对 象 4 装 人 背包 ， 然 后 是 对 象 3。 所 以 在 子 树 E 中 无 节点 有 多 于 cp+4+7=20 的 收益 。 如 果 


已 经 找到 一 个 收益 为 20 或 更 多 的 解 ， 则 不 必 搜 索 下 子 树 。 国 
如 果 对 象 按 收益 密度 递减 顺序 排列 ， 那 么 这 个 定 界 函数 是 容易 实现 的 。 
2. 用 C++ 实现 


背包 问题 的 回溯 算法 使 用 了 结构 element， 其 数据 成 员 是 id ( 元 素 标志 符 ， 整 型 ) 和 
profitDensity( 双 浮 点 型 )。 其 中 还 定义 了 一 个 向 双 泽 点 型 的 类 型 转换 ， 返 回 profitDensity 的 
值 。 有 了 这 个 转换 ， 一 组 元 素 排 序 之 后 就 可 以 产生 按 收益 递增 顺序 的 排列 。 递 归 回 淹 算 法 所 
使 用 的 全 局 变量 如 程序 20-6 所 示 。 


程序 20-6 ”背包 装载 问题 回 湖 算 法 的 全 局 变量 


double capacity; 

int numberOfObjects; 

double *weight; /weight[l:numberotobjects] --> 对 象 重量 
double *profit; 

double weightOfCurrentPacking; 

double profitFromCurrentPacking; 

double maxProfitSoFar; 


函数 knapsack ( 程序 20-7) 返回 背包 最 优 填充 的 收益 值 。 这 个 函数 首先 建立 类 型 为 
element 的 数组 q， 它 包含 所 有 对 象 的 收益 密度 。 然 后 使 用 归并 排序 mergeSort ( 程序 18-3 ) , 按 
照 收益 密度 递增 顺序 把 数组 q 排序 。 接 下 来 ， 使 用 排序 的 结果 ， 给 全 局 变量 profit 和 weight 
赋值 ， 使 profit[i]/weight[i] 三 profit[i-1]/weight[i-1]。 这 些 准 备 工作 完成 之 后 ， 调 用 递归 函数 
rKnap( 程序 20-8 )， 实 际 地 实施 回溯 算法 。 

注意 ， 函 数 IKnap 和 rLoad (程序 20-2 ) 是 相似 的 。 程 序 20-9 是 界定 函数 。 注 意 ， 程 
序 20-8 仅 当 向 右 孩 子 移动 时 ， 才 计算 界定 函数 。 当 向 左 孩子 移动 时 ， 左 孩子 的 界定 函数 值 与 
其 父 节 点 的 相同 。 


程序 20-7 函数 knapsack 


double knapsack (double *theProfit, double *theweight, 
int theNumberOfObjects, double theCapacity) 
{// 数组 theProfit[1:theNumberOfObjects] 是 对 象 收 益 
/数组 hewWeight[1:theNumberOftobjects] 是 对 象 重量 
/变量 theCcapacity 是 背包 容量 
1// 返回 最 优 填充 收益 
/初始 化 全 局 变量 
capacity = theCapacity; 
numberOfobjects = theNumberOfObjects; 
weightOfCurrentPacking = 0.0; 
profitFromCurrentPacking = 0.0; 
maxProfitSoFar = 0.0; 


/定义 一 个 类 型 为 结构 element 的 数组 ， 存 储 收益 密度 


element *q = new element [numberOfObjects]; 
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1/ 在 数组 q[0:n-1] 中 存储 收益 密度 值 
for (int i = 1l; i <= numberOfObjects; i++) 
qli - 1] = element (i, theProfit[i] / theWeight [i]); 


1/ 授 照 收益 密度 递增 顺序 排序 
mergeSort(q, numberOfObjects); 


/初始 化 剩余 全 局 变量 
profit = new double [numberOftobJjects + 1]; 
weight = new double [numberOofObjects + 1]; 


for (int i = 1; i <= numberOfObijects; i++) 
{1/ 按 密 度 递减 顺序 排列 的 收益 和 重量 
Profit [il = theProfit[lq[numberofObjects - i].id]; 
weight[i] = theWweight[q[numberOfObjects - i].id]; 
} 
rKnap (1); // 计算 最 大 收益 


return maxProfitSoFar; 





程序 20-8 ”0/1 背包 问题 的 递归 回溯 函数 


void rKnap (int currentLevel) 
{1/ 从 currentLevel 中 的 一 个 节点 开始 搜索 
if (currentLevel > numberOfObjects) 
{W 到 达 一 个 叶 节 点 
maxProfitSoFar = profitFromCurrentPacking; 
return; 


1/ 没有 达到 一 个 叶 节 点 ， 检 查 子 树 
if (weightOfCurrentPacking + weight [currentLevel] <= capacity) 
{W 搜索 左 子 树 
weightofCurrentPacking += weight[currentLevel]; 
profitFromCurrentPacking += profit[currentLevell]; 
rKnap (currentLevel + 1); 
weightOfCurrentPacking -= weight[currentLevell]; 
profitFromCurrentPacking -= profit[lcurrentLevell]; 
} 
if (profitBound(currentLevel + 1) > maxProfitSoFar) 
rKnap (currentLevel + 1);  // 搜 索 右 子 树 





程序 20-9 背包 界定 函数 
double ProfitBouna (int currentLevel) 
{W 界定 函数 
/返回 子 树 中 最 优 叶 节点 的 值 的 上 界 
double remainingCapacity = capacity - weightOfCurrentPacking; 
double profitBound = profitFromCurrentPacking; 





/按照 收益 密度 顺序 填充 剩余 容量 
while (currentLevel <= numberOfObjects && 
weight [currentLevel] <= remainingCapacity) 
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remainingCapacity -= weight [currentLevell]; 
profitBound += profit[currentLevell]; 
currentLevel++; 

} 


1/ 取 下 一 个 对 象 的 一 部 分 
if (currentLevel <= numberOfObjects) 
profitBound += profit[currentLevel] / weight[currentLevel] 
* remainingCapacity; 
return profitBound; 


] 


3. 复杂 度 分 析 

rKnap 的 复杂 度 是 0(2”)， 即 使 复杂 度 为 O(n) 的 界定 函数 要 在 0(2”) 个 右 孩 子 处 进行 
计算 。 为 达到 这 个 复杂 度 ， 注 意 ， 在 计算 界定 因数 时 ， 如 果 进 入 profitBound 的 while 循环 
g 次 ， 那么 在 界定 函数 计算 之 后 要 向 左 孩 子 移动 q 次 。 下 信人 np 出 活 和 六 程 中 ， 进入 
profitBound 的 while 循环 次 数 不 会 多 于 向 左 孩 子 移动 的 次 数 。 这 个 数 是 0(2”)。 因 此 ， 计算 界 
定 函 数 的 总 时 间 是 0(2”)。 


20.2.3 ”最 大 完备 子 图 


1. 问题 描述 

令 U 为 无 向 图 G 的 项 点子 集 ， 当 且 仅 当 对 于 U 中 任意 顶点 4 和 v，(u,v) 都 是 图 G 的 
一 条 边 时 ,U 是 一 个 完全 子 图 ( complete subgraph )。 子 图 的 大 小 (size ) 是 子 图 中 顶点 的 数 
量 。 当 且 仅 当 一 个 完全 子 图 不 包含 于 G 的 一 个 更 大 的 完全 子 图 时 ， 它 是 图 G 的 一 个 完备 子 图 
(clique )。 最 大 完备 子 图 ( max clique ) 是 最 大 的 完备 子 图 . 





QQ) @Q) (DD 饭 
] 本 | 2 ee 
| | 3) / 3) 
| ~ i a 
一 一 所 4 © 
a) 图 G b) G 的 补 图 G 


图 20-7 图 和 补 图 


例 20-8 在 图 20-7a 中 ， 子 集 {1,2} 是 一 个 大 小 为 2 的 完备 子 图 。 这 个 子 图 不 是 一 个 
完备 子 图 ， 因 为 它 包 含 于 一 个 更 大 的 完备 子 图 {1,2,5}。{1,2,5} 是 一 个 最 大 完备 子 图 。 点 集 
{1,4,5} 和 {2,3,5} 是 另外 两 个 最 大 完备 子 图 。 国 

当 且 仅 当 对 于 U 中 的 任意 项 点 u 和 v，(u,v) 都 不 是 C 的 一 条 边 时 ， U 是 一 个 空子 图 。 当 
且 仅 当 一 个 子 集 不 包含 于 一 个 更 大 的 点 集 ， 并 且 后 者 还 是 空子 图 时 ， 该 子 集 是 图 G 的 一 个 独 
立 集 (independent set )。 最 大 独立 集 ( max-independent set ) 是 最 大 的 独立 集 。 对 于 任意 图 G， 
它 的 补 图 (complement ) G 是 和 G 有 同样 点 集 的 图 ， 且 当 且 仅 当 (wv) 不 是 G 的 一 条 边 时 ， 
它 是 G 的 一 条 边 。 

例 20-9 ”图 20-7b 是 图 20-7a 的 补 图 ， 反 之 亦 然 。{2,4} 是 图 y 7a 的 一 个 空子 图 ， 而 且 
是 图 20-7a 的 一 个 最 大 独立 集 。 虽然 {1,2} 是 图 20-7b 的 一 个 空子 图 ,但 它 不 是 一 个 独立 集 ， 
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因为 它 包 含 于 空子 图 {1,2,5} 中 。{1,2,5} 是 图 20-7b 的 一 个 最 大 独立 集 。 回 

注意 ， 如 果 忆 是 G 的 一 个 完全 子 图 ,那么 它 也 是 G 的 一 个 空子 图 ， 反 之 亦 然 。 所 以 在 
G 的 完备 子 图 与 G 的 独立 集 之 间 有 对 应 关系 。 特 别 是 ，G 的 一 个 最 大 完备 子 图 是 G 的 一 个 最 
大 独立 集 。 

最 大 完备 子 图 问题 是 指 寻 找 图 G 的 最 大 完备 子 图 。 类 似 地 ， 最 大 独立 集 问题 是 指 寻找 图 
G 的 一 个 最 大 独立 集 。 这 两 个 问题 是 NP- 复杂 问题 。 当 有 算法 解决 一 个 问题 时 ， 也 就 解决 了 
另 一 个 问题 。 例 如 ， 如 果 有 一 个 算法 ， 可 以 求解 最 大 完备 子 图 问题 ， 那 么 这 个 算法 也 能 解决 
最 大 独立 集 问 题 ， 做 法 是 先 计 算 图 的 补 图 ， 然 后 寻找 补 图 的 最 大 完备 子 图 。 


例 20-10 假定 由 个 动物 构成 一 个 集合 。 可 以 定义 一 个 个 项 点 的 相 容 图 G。 当 且 仅 
当 动 物 w 和 v 相 容 时 ，(wv) 是 G 的 一 条 边 。G 的 一 个 最 大 完备 子 图 是 由 相互 间 相 容 的 动物 构 
成 的 最 大 子 集 。 


在 19.2.5 节 ， 我 们 考察 了 网 组 中 最 大 无 交叉 子 集 问 题 ， 这 个 问题 可 以 看 做 是 一 个 最 大 独 
立 集 问 题 。 定 义 一 个 图 ， 每 个 顶点 表示 一 个 网 组 。 两 个 顶点 之 间 有 一 条 边 ， 当 且 仅 当 它们 对 
应 的 网 组 是 交叉 的 。 该 图 中 一 个 最 大 独立 集 对 应 网 组 中 一 个 最 大 无 交叉 子 集 。 当 网 组 有 一 个 
端点 在 布线 通道 顶部 ， 另 一 端 在 底部 时 ， 存 在 这 样 的 算法 ， 它 可 以 在 多 项 式 时 间 ( 实际 上 是 
QO(m) ) 内 找到 网 组 的 最 大 无 交叉 子 集 。 但 是 当 一 个 网 组 的 端点 可 能 在 任意 地 方 时 ， 就 不 存在 
这 样 的 算法 了 。 国 

2. 回溯 求解 

最 大 完备 子 图 问题 和 最 大 独立 集 问题 可 由 回溯 算法 在 O(n2") 时 间 内 解决 。 两 个 问题 都 可 
以 用 解 空间 的 子 集 树 ( 如 图 20-2 所 示 ) 来 描述 。 考察 最 大 完备 子 图 问题 ， 其 递归 回溯 算法 与 
程序 20-3 非常 相似 。 若 要 移动 到 空间 树 的 i 层 节 点 Z 的 左 孩 子 ， 则 需要 证 明 从 顶点 i 到 其 他 


的 每 一 个 顶点 j (在 从 根 到 ZZ 的 路 径 上 ，xj=1 ) 有 一 条 边 。 若 要 移动 到 Z 的 右 护 子 ， 则 需要 证 
明 在 右 子 树 还 有 足够 多 的 未 检查 的 顶点 ， 以 致 可 能 存在 一 个 较 大 完备 子 图 。 
3. 用 C++ 实现 


回溯 算法 可 作为 类 adjacencyGraph( 见 16.7 节 ) 的 一 个 成 员 来 实现 ， 为 此 首先 要 在 类 中 加 
入 静态 成 员 currentClique ( 整 型 数组 ， 用 于 存储 到 达 当 前 节点 的 路 径 )，maxCliqueFoundSoFar 
( 整 型 数组 ， 保 存 当前 最 优 解 )，sizeOfMaxCliqueFoundSoFar ( maxCliqueFoundSoFar 中 的 顶 
点 数量 )，sizeOfCurrentClique (currentClique 中 的 顶点 数量 )。 

公有 方法 btMaxClique ( 见 程序 20-10 ) 初始 化 类 中 必要 的 数据 成 员 。 然 后 调用 保护 方法 
rClique ( 见 程序 20-11 )。 方 法 rClique 使 用 回溯 算法 实际 地 搜索 解 空 间 。 


程序 20-10 . 方法 adjacencyGraph::biMaxClique 


int btMaxClique (int *maxClique) 
{// 用 回溯 法 求解 最 大 完备 子 图 问题 
// 设置 maxClique[] 使 得 maxCliaque[il = 1 当 且 仅 当 工 属 于 最 大 完备 子 图 
1/ 返回 最 大 完备 子 图 的 大 小 
1/ 为 rclique 初始 化 
currentClique = new int [n+ 1]; 
sizeOfCurrentClique = 0; 
sizeOfMaxCliqueSoFar = 0; 
maxCliqueSoFar = maxClique; 


1/ 寻找 最 大 完备 子 图 
rclique(1); 


委 20 旭 回 汶 法 517 





return sizeOfMaxCliqueSorFar; 


程序 20-11 寻找 最 大 完备 子 图 的 递归 回溯 方法 
void rClique (int currentLevel) 
{1/ 从 currentLevel 处 的 节点 开始 搜索 
if (currentLevel > n) 
{1/ 到 达 叶 节点 ,发 现 一 个 最 大 完备 子 图 
1/ 更 新 maxCliqueSoFar 和 sizeOfMaxCliqueSoFar 





for (int J = 1 <= ny +4) 
maxCliqueSoFar[j] = currentClique[j}; 
sizeOfMaxCliqueSoFar = sizeOfCurrentClique; 
return; 
} 
// 没有 达到 叶 节 点 ; 查看 顶点 currentLevel 是 否 与 当前 完备 子 图 的 其 他 顶点 连通 
bool connected = true; 
for (int J = 1; 1 < currentlLevel; j++) 
if (currentCligue[ij] == 1 && !a[lcurrentLevel] [jl) 
1// 顶点 currentLevel 与 顶点 j 不 连通 
connected = false; 
break; 
} 
if (connected) 
{1/ 搜索 左 子 树 
currentclique[currentLevel] = 1; 1// 加 到 完备 子 图 


sizeOfCurrentClique++} 
rclique (currentLevel + 1); 
sizeOfCurrentClique-—-} 


} 


if (sizeOfCurrentClique + n - currentLevel > sizeOfMaxCliqueSoFar) 
1// 搜索 右 子 树 

currentClique[currentLevel] = 0; 

rcClique (currentLevel + 1); 


20.2.4 旅行 商 问题 


1. 回 漳 法 求解 

旅行 商 问题 ( 例 20-3 ) 的 解 空间 是 一 棵 排列 树 。 这 样 的 树 可 用 函数 perm ( 见 程序 1-32 ) 
搜索 ， 生 成 元 素 表 的 所 有 排列 。 如 果 以 x=[1,2…,n] 开始 ， 那 么 从 x 到 x, 的 所 有 排列 ， 可 生 
成 n 顶点 旅行 商 问题 的 解 空 间 。 可 以 修改 函数 perm， 使 其 生成 的 排列 中 既 没 有 那些 不 可 行 的 
前 级 ( 即 不 会 产生 路 径 的 前 级 )， 也 没有 那些 不 可 能 产生 比 当前 最 优 旅行 更 优 者 的 前 级 ， 而 且 
这 种 修改 并 不 难 。 注 意 ， 在 一 棵 排列 空间 树 中 ， 由 任意 子 树 的 叶 节 点 定义 的 排列 有 相同 的 前 
级 ( 如 图 20-5 所 示 )。 所 以 ， 要 排除 某 些 前 级 相当 于 不 搜索 某 些 子 树 。 

2. 用 C++ 实现 

旅行 商 问题 的 回溯 算法 作为 类 adjacencyWDigraph ( 见 程序 16-2 ) 的 一 个 成 员 来 实现 是 
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再 好 不 过 了 。 这 需要 增加 数据 成 员 partialTour ( 整 型 数组 ， 用 来 记录 到 达 当 前 节点 的 旅行 )、 
bestTourSoFar 、costOfBestTourSoFar 和 costOfPartialTour。 在 其 他 例子 中 ， 有 两 个 成 员 函 数 : 
btSalesperson 和 rTSP。 前 者 是 公有 成 员 ， 后 者 是 保护 成 员 。btSalesperson ( 见 程序 20-12 ) 实 
质 上 是 tTSP 的 预 处 理 程序 ， 它 在 排列 树 空间 中 实施 递归 回溯 搜索 。 预 处 理 程 序 btSalesperson 
出 现在 程序 20-12 中 ， 它 调用 rTSP(2) 来 搜索 排列 树 ， 这 棵 树 包 含 partialTour[2:n] 的 所 有 排列 。 


程序 20-12 ”旅行 商 回溯 法 的 预 处 理 程序 


T btSalesperson (int *bestTour) 
1 旅行 商 间 题 的 回溯 法 
/把 bestTour[1:n] 设置 为 最 优 旅行 
/返回 最 优 旅 行 成 本 





1/ 此 处 省 去 的 代码 是 用 来 验证 *this 是 加 权 图 的 


// 设置 partialTour 为 一 个 恒 等 排列 


partialTour = Tew int [na + 1]; 
GF (i 六 志 示人 迁 Rs 孜 和 注 村 本》 
partialTour[i] = i;} 


CostOfBestTourSoFar = noEdge; 
bestTourSoFar = bestTour; 
costOfPartialTour = 0; 


1// 搜索 partialTour[2:n] 的 排列 
TD {1 


return costOfBestTourSoFar; 


} 


程序 20-13 是 函数 rTSP。 它 的 结构 与 函数 perm ( 见 程序 1-32) 的 结构 相同 。 当 
currentLevel=n 时， 我 们 处 在 排列 树 的 一 个 叶 节 点 的 父 节点 上 上， 首先 需 要 验证 从 
partialTour[n-1] 到 partialTour[n] 有 一 条 边 ， 从 partialTour[n] 回 到 始点 1 也 有 一 条 边 。 若 两 条 
边 都 存在 ， 则 找到 一 个 新 旅行 。 在 本 例 中 ， 需 要 验证 这 个 旅行 是 否 为 当前 发 现 的 最 优 旅行 。 
如 果 是 ， 将 这 个 旅行 及 其 费用 分 别 存储 在 bestTourSoFar 和 costOfBestTourSoFar 中 。 

当 currentLevel<n 时 ， 只 要 满足 下 列 条 件 ， 我 们 就 移动 到 当前 节点 的 一 个 孩子 节点 : 
1 ) 从 partialTour[currentLevel-1] 到 partialTour[currentLevel] 有 一 条 边 ( 若 如 此 ， 则 partialTour[1: 
currentLevel] 定义 了 网 络 中 的 一 条 路 径 ); 2 ) 路 径 partialTour[1: currentLevel] 的 费用 少 于 当前 最 
优 旅行 的 费用 ( 如果 不 是 这 样 ， 这 条 路 径 不 能 产生 一 个 更 优 的 旅行 )。 


程序 20-13 ”旅行 商 问题 的 递归 回溯 算法 
void rTSP(int currentLevel) 
{VW 旅 行商 问题 的 递归 回溯 代码 
/从 currentLevel 处 的 节点 开始 ， 搜 索 排 列 树 ， 寻 找 最 优 旅行 
if (currentLevel == n) 
{1/ 在 一 个 叶 节 点 的 父 节 点 
/增加 最 后 两 条 边 ， 以 完成 旅行 





if (a[PartialTour[In -= 1]][partialTour[n]] != noEdge && 
alpartialTour[n]] [1] != noEdge && 
(costOfBestTourSoFar == noEdge || 


costOofPartialTour + a[lpartialTour[n -= 1]] [partialTour[n]] 
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+ alpartialTour[n]] [1] < costOfBestTourSoFar)) 
{V 发 现 更 优 的 旅行 
copy (partialTour + 1, partialTour + n + lr bestTourSoFar + 1); 
costOfBestTourSoFar = costOfPpartialTour 
+ a[lpartialTour[ln - 1]] [partialTour[n]] 
+ alpartialTour[n}]] [1]; 
} 
} 
else 
{1/ 搜索 子 树 
for (int j = currentLevel; j <= n; j++) 
1// 移动 到 子 树 partialTour1j] 是 可 行 的 吗 ? 
if (alpartialTour[currentLevel - 1]][partialTour[j]] != nokEdge 
&& (costOfBestTourSoFar == nokEdge || 
costOofPartialTour + 
alpartialTour[currentLevel - 1]] [partialTour[j]] 
< costofBestTourSoFar)) 
{/ 搜索 这 棵 子 树 
swap (partialTour [currentLevel], partialTour[j]); 
costofPartialTour += alpartialTour[currentLevel - 1]] 
[partialTour[currentLevelll]; 
rTSP(currentLevel + 1); 
costOfPartialTour -= alpartialTour[currentLevel - 1]] 
[partialTour[currentLevel]l]; 
swap (partialTour[currentLevel], partialTour{[j]); 


} 


3. 复杂 度 分 析 

每 次 找到 一 个 更 好 的 旅行 ， 除 了 更 新 bestTourSoFar 的 耗费 外 ，rTSP 需 耗 时 O(n-1)1)。 
因为 需要 O((n-1)!) 次 更 新 ， 每 次 更 新 需 耗 时 @(n)， 所 以 更 新 所 需 时 间 为 O(n*(n-1)!)。 因 此 总 
的 时 间 复 杂 度 为 O(n!)。 在 加 强 的 条 件 下 ( 见 练习 16 )， 能 减少 由 rTSP 搜索 的 树 节点 的 数量 。 


20.2.5 电路 板 排列 














1. 问题 描述 
在 大 规模 电子 系统 的 设计 中 出 现 了 电路 板 排列 问题 。 这 个 问题 的 典型 形式 是 ,将 nn 个 
电路 板 插 到 一 个 机 箱 的 插 槽 中 ( 如 图 20-8 所 示 )。n 个 电路 板 的 每 和 
一 种 排列 都 定义 了 一 种 插入 方法 。 令 B={b1,…,b»} 表示 nn 个 电路 2 
板 。L={Ni,…,Nm} 是 电路 板 上 的 m 个 网 组 。N; 是 B 的 子 集 ， 子 集 
中 的 电路 板 需要 连接 。 实 际 的 连接 是 用 电线 经 插 醒 将 这 些 电 路 板 
连接 起 来 。 
例 20-11 令 n=8，m=5。 给 定 的 电路 板 和 网 组 如 下 : 图 20-8 带 有 插 槽 的 机 箱 


B={b1,b2,b3,babs, be bybs} 
L={Ni Na Ns Na Ns} 
Ni={ba,bs,be} 
Ns={b2bs} 
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N3={b1,b;} 
Ns={babe) 
Ns={b7,bs} 
图 20-9 是 电路 板 的 一 个 可 能 的 排列 。 边 表示 在 电路 板 之 间 的 连 线 。 


AN 





NV ] 
| | "1 济 
| 
1 1 | | 
b; bi b, b, b; bs b, 
1 3 5 6 于 8 





4 
插 横 编号 
图 20-9 电路 板 布 线 


令 x 为 电路 板 的 一 个 排列 。 利 用 排列 x;:， 电 路 板 x; 放置 到 机 箱 的 插 权 i 中 。density(x) 为 
机 箱 中 任意 一 对 相 邻 插 槽 间 连 线 数目 的 最 大 值 。 在 图 20-9 的 排列 中 ， 密 度 为 2。 用 两 根 电线 
连接 的 相 邻 择 模 有 2 和 3，4 和 5,，5 和 6。 插 权 6 和 7 之 间 无 电线 ， 余 下 的 相连 插 横 都 只 有 
一 根 电线 。 

板式 机 箱 的 设计 是 有 统一 间距 的 ( 相 邻 插 槽 间 的 距离 是 相同 的 )， 这 个 间距 决定 了 机 箱 的 
大 小 。 间 距 的 大 小 必须 足够 容纳 相 邻 插 槽 间 的 连 线 。 因 此 ， 这 个 间距 ( 继而 机 箱 的 大 小 ) 由 
density(x) 决定 。 

2. 回溯 求解 

电路 板 排列 问题 的 目标 是 找到 一 种 电路 板 的 排列 ， 使 其 具有 最 小 的 density。 这 是 一 个 
NP- 复杂 问题 ， 不 可 能 有 一 个 多 项 式 时 间 内 的 算法 可 以 解决 这 个 问题 。 回 漳 搜 索 算法 是 解决 
这 个 问题 的 一 种 较 好 的 选择 。 回 溯 算 法 将 搜索 排列 树 ， 以 寻找 最 优 的 电路 板 排 列 。 

3. 用 C++ 实现 

用 一 个 整 型 数组 board 表示 输入 ， 使 得 当 且 仅 当 网 组 NW 包含 电路 板 b; 时，board[i][j]=1 
(也 可 以 用 布尔 型 数组 ， 以 节省 空间 )。 令 boardsWithNet[j] 为 包含 网 组 N; 的 电路 板 数量 。 对 
于 任意 部 分 的 电路 板 排 列 partial[1:i] ， 今 boardsInPartialWithNet[j] 为 partial[1:i] 中 包含 网 组 N, 
的 电路 板 数 量 。 当 且 仅 当 boardsInPartialWithNet[j]>0 且 boardsInPartialWithNet[j] 关 boardsWith 
Net[j] 时 ， 网 组 在 择 槽 了 上 和 it1 之 间 有 连 线 。 用 这 种 测试 方法 可 以 计算 插 模 上 和 寺 1 间 的 线 
密度 ， 以 确定 有 哪些 线路 连接 这 两 个 插 槽 。 揪 槽 上 和 人 #1(1 大 大友 站 间 的 线 密 度 的 最 大 值 给 
出 了 局 部 排列 的 密度 。 

程序 20-14 给 出 了 函数 arrangeBoards， 它 实际 上 是 递归 函数 rBoard ( 程序 20-15 ) 的 预 
处 理 程序 。arrangeBoards 返回 最 优 电路 板 排列 的 密度 ， 最 优 排列 由 数组 bestPermutation 返回 。 
所 有 变量 都 没有 明确 声明 为 全 局 变量 。 

函数 arrangeBoards 首先 初始 化 全 局 变量 。 尤 其 是 ， 初 始 化 boardsWithNet， 使 得 boardsWith- 
Net[] 等 于 N 中 电路 板 的 数量 。boardsInPartialWithNet[1:n] 具有 缺 省 值 0， 与 一 个 空 的 局 部 排 
列 相 对 应 。 调 用 rBoard(1,0) 搜索 partial[1:numberOfBoards] 的 排列 树 ， 从 密度 为 0 的 空 排列 
中 去 寻找 一 个 最 优 的 排列 。 通 常 ，rBoard(currentLeveLdensityOfPartial) 寻找 局 部 排列 partial[1: 
currentLevel-1] 的 最 优 布局 。 这 个 局 部 排列 的 密度 是 densityOfPartial。 

冰 数 rBoard ( 见 程序 20-15) 和 程序 20-13 有 同样 的 结构 ， 程 序 20-13 也 搜索 一 个 
排列 空间 。 然 而 在 程序 20-15 中 ， 当 i=numberOfBoards 时 ， 所 有 电路 板 已 进入 插 槽 日 
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densityOfPartial 为 全 排列 的 密度 。 既 然 这 个 算法 只 寻找 那些 比 当 前 最 优 排列 还 优 的 排列 ， 所 
以 不 必 验 证 densityOfPartial 是 否 比 leastDensitySoFar 要 小 。 当 currentLevel<numberOfBoards 
时 ,排列 还 未 完成 。partial[1: currentLevel-1] 是 当前 节点 的 局 部 排列 ， 而 且 densityOfPartial 
是 它 的 密度 。 这 个 节点 的 每 一 个 孩子 要 在 末端 增加 一 个 电路 板 ， 以 扩充 这 个 局 部 排列 。 对 每 
一 个 这 种 扩充 ， 密 度 density 都 要 重新 计算 ， 而 且 只 有 对 density<leastDensitySoFar 的 节点 才 
搜索 ， 对 其 他 的 节点 和 它们 的 子 树 不 搜索 。 

4. 复杂 度 分 析 

在 排列 树 的 每 一 个 节点 ， 函 数 rBoard 计算 每 一 个 孩子 节点 的 密度 需 用 时 8(m)。 所 以 计 
算 密 度 的 总 时 间 为 O(mn!)。 除 此 之 外 ， 生 成 排列 所 需 时 间 为 0(n!)， 更 新 最 优 排列 所 需 时 间 
为 O(mn)。 注 意 ， 每 一 次 更 新 至 少将 bestDensitySoFar 的 值 减 1， 最 终 bestDensitySoFar 三 0。 
所 以 更 新 的 次 数 是 O(m)。 函 数 rBoard 的 复杂 度 为 O(mnl!)。 


程序 20-14 rBoard 函数 ( 程序 20-15 ) 的 预 处 理 程序 


int arrangeBoards (int **theBoard, int theNumberOfBoards, 
int theNumberOofNets, int *bestPermutation) 

{1/ 递归 回 济 函 数 的 预 处 理 程序 
1// 返回 最 优 布 局 的 密度 

/ 初始 化 全 局 变量 

numberOfBoards = theNumberOfBoards; 

numberOfNets = theNumberOfNets; 

partial = new int [numberOfBoards + 1]} 





bestPermutationSoFar = bestPermutation; 
boardsWithNet = new int [numberOQfNets + 1]; 
fill (boardsWithNet + 1, boardsWithNet + numberOfNets + 1, 0); 
boardsInPartialWithNet = new int [numberOfNets + 1]; 
fill (boardsInPartialWithNet + 1, 
boardsInPpartialWithNet + numberOfNets + 1, 0); 
leastDensitySoFar = numberOfNets + 1; 
board = theBoardgd; 


1// 初始 化 partial 为 恒定 排列 
// 计算 boardsWithNet [] 
for (int i = 1; i <= numberOfBoards; i++) 
{ 
Partial[i]l = i; 
for (int j = 1; j <= numberOfNets; j++) 
boardsWithNet[j] += boardl[il[j]; 
} 


/寻找 最 优 布局 
rBoard(1, 0); 
return leastDensitySoFar; 





程序 20-15 ”搜索 排列 树 


void rBoard(int currentLevel, int densityOfPartial) 
{1/ 从 currentLevel 层 的 一 个 节点 开始 搜索 

IE (currentLevel == numberOfBoards) 

{1/ 所 有 电路 板 已 就 位 ， 现 在 是 一 个 更 好 的 排列 


for (int j = 1; j <= numberOfBoards; j++) 
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bestPermutationSoFar[j] = Partial[]j]y; 
leastDensitySoFar = densityOfPartial; 
} 
else /搜索 子 树 
for (int ]j = currentLevel; J <= numberOfBoards; j++) 


{1/ 用 partial[j] 作为 下 一 个 电路 板 检查 孩子 节点 


/在 最 后 一 个 插 槽 更 新 boardsInPartialWwithNet[] ， 计 算 密 度 
int density = 0; 
for (int k = 1; k <= numberOfNets; k++) 
{ 
boardsInPartialWithNet[k] += board[partial{[i]][k]; 
if (boardsInPartialWithNet[k] > 0 gg& 
boardsWithNet[k] != boardsInpartialWithNet[k]) 
density++;} 
} 


1/1/ 将 density 更 新 为 局 部 排列 的 总 密度 
if (densityOfpartial > density) 
density = densityOfPartial; 


/ 只 要 子 树 包含 更 优 的 排列 ， 就 搜索 该 子 树 
if (density < LeastDensitySoFar) 
{W 移动 到 孩子 节点 
swap (partial[currentLevel], partialil[j]); 
rBoard(currentLevel + 1, density); 
swap (partiallcurrentLevel], partial[j]); 
} 


1/ 重 置 boardsInPartialWithNet[] 
for (int k = 1; k <= numberOfNets; k++) 
boardsInPartialWithNet[k] -= board[partial[J]][k]'， 


练习 


4. 两 船 装载 的 策略 是 ， 尽 可 能 先 装 满 第 一 租 船 。 证 明 ， 只 要 存在 一 种 方法 能 把 所 有 货 箱 装载 
到 两 条 船上 去 ， 两 船 装载 的 策略 就 是 可 行 的 。 

5. 运行 程序 20-3 和 程序 20-5， 测 试 它们 的 相对 运行 时 间 。 

6. 使 用 策略 1 来 编写 程序 20-3 的 一 个 新 版 本 ,使 其 时 间 复 杂 度 达到 O(27)。 

7. 使 用 策略 2 来 修改 程序 20-3， 使 其 时 间 复 杂 度 减少 至 0(2”)。 

8. 编写 一 个 递归 回溯 算法 求解 子 集 之 和 问题 。 在 这 个 问题 中 ， 给 定 一 个 表示 重量 的 整 型 数组 ， 
要 求 找 出 其 重量 之 和 等 于 c 的 子 集 。 注 意 ， 只 要 这 样 的 子 集 找 到 ， 算 法 就 可 以 终止 。 不 用 
记录 当前 最 优 解 。 不 要 使 用 程序 20-3 中 的 数组 x。 而 是 要 在 和 为 c 的 一 个 子 集 找 到 之 后 ， 
随 着 递归 的 扩展 ， 重 构 解 。 

9. 优化 程序 20-7， 以 便 能 计算 一 个 与 背包 问题 最 优 解 相对 应 的 0/1 数组 x。 

10. 设计 一 个 迭代 回 济 算 法 求解 0/1 背包 问题 。 该 算法 应 该 与 程序 20-5 类 似 。 注 意 ， 可 以 修改 
定 界 函 数 ， 使 得 在 计算 一 个 定 界 函 数 之 后 ， 可 直接 移动 到 最 左面 的 节点 。 

11. 编写 程序 20-11 ( 与 程序 20-5 对 应 ) 的 迭代 版 本 ， 并 比较 这 两 个 版 本 的 优点 。 
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12. 改写 程序 20-10， 使 其 首先 按 度 的 递减 次 序 对 顶点 排序 。 你 认为 改写 后 的 程序 比 程序 
20-10 更 好 吗 ? 

13. 编写 一 个 回溯 算法 ,求解 最 大 独立 集 问 题 。 

14. 重 写 最 大 完备 子 图 代码 ( 见 程序 20-10 和 程序 20-11 )， 它 与 实现 无 关 。 新 代码 是 抽象 类 
graph ( 见 程序 16-1 ) 的 成 员 。 对 于 类 adjacencyGraph 、adjacencyWGraph 、linkedGraph 和 
linkedWGraph ( 见 16.7 节 ) 的 实例 ， 该 代码 都 同样 有 效 。 

15. 令 G 为 一 个 1 顶点 的 有 向 图 。 令 Max; 为 始 于 顶点 i 的 消费 最 大 的 边 的 消费 。 

1 ) 证 明 旅行 商 的 每 一 个 旅行 有 一 个 小 于 Max, +1 的 消费 。 
2 ) 使 用 上 述 消费 界限 作为 costOfBestTourSoFar 的 初 值 。 重 写 btSalesperson 和 rTSP， 尽 


可 能 简化 代码 。 
16. 令 G 是 一 个 nn 顶点 的 有 向 图 ，MinOut; 为 始 于 顶点 i 的 消费 最 小 的 边 的 消费 。 


1 ) 证 明 具 有 前 缀 x 到 xi 的 旅行 商 的 所 有 旅行 ， 其 费用 至 少 为 4Q@sx) + MinOut, ， 
其 中 4(w,v) 是 边 (uv) 的 费用 。 和 > 
2 ) 使 用 1) 的 结果 ， 我 们 得 到 一 个 用 于 程序 20-13 的 比 下 面条 件 更 强 的 条 件 
if (a[lpartialTour[lcurrentLevel-1]] [partialTour[jcostOfPal]]!=noEdge 
&& (costOfBestTourSoFar==noEdge)|| 
CostOofPartialTour 


+alpartialTour[currentLevel-1]] [partialTour[j]] 
<costOfBestTourSoFar )) 


使 用 这 个 条 件 来 决定 何 时 移动 到 一 个 孩子 节点 。 由 costOfPartialTour 很 容易 计算 第 一 个 
和 。 用 一 个 新 变量 minAdditionalCost 保留 不 在 当前 路 径 中 的 顶点 的 MinOut; 之 和 ， 由 此 
很 容易 计算 第 二 个 和 。 

3 ) 测试 rTSP 的 新 版 本 。 与 程序 20-13 比较 ， 它 访问 了 排列 树 中 多 少 节点 ? 

17. 考察 电路 板 排列 问题 。 一 个 网 组 的 长 度 是 包含 这 个 网 组 第 一 块 和 最 后 一 块 电 路 板 间 的 距 
离 。 对 于 图 20-9， 网 组 Ns 中 的 第 一 个 电路 板 在 插 模 3 中 ,最 后 一 个 电路 板 在 插 槽 6 中 ， 
因此 Ni 的 长 度 为 3。 网 组 N; 的 长 度 是 2， 因 为 它 的 第 一 个 电路 板 在 插 模 1， 最 优 一 个 电 
路 板 在 插 槽 3。 图 20-9 中 最 长 的 网 组 长 度 是 3。 编写 一 个 回溯 算法 来 寻找 一 个 电路 板 排 
序 ， 它 的 最 长 网 组 长 度 是 最 短 的 。 测 试 代码 的 正确 性 。 

18. [ 顶点 覆盖 ] 已 知 G 为 一 个 无 向 图 。 称 G 的 一 个 顶点 子 集 U 是 一 个 顶点 覆盖 ( vertex 

cover )， 当 且 仅 当 G 中 的 每 一 条 边 必 有 一 个 顶点 属于 U 或 两 个 顶点 都 属于 U。U 中 顶点 的 

数量 是 覆盖 的 大 小 ( size )。 在 图 20-7a 中 ，{1,2,5} 是 一 个 大 小 为 3 的 顶点 覆盖 。 编 写 一 个 

回溯 算法 寻找 最 小 的 项 点 覆盖 。 确 定 算法 的 复杂 度 。 

.[ 简 易 最 大 切割 ] 已 知 G 是 一 个 无 向 图 。 令 U 是 G 中 顶点 的 任意 子 集 。 令 VV 是 G 中 剩余 

顶点 的 集合 。 这 样 一 来 ,，U 便 把 G 的 顶点 做 了 一 个 切割 (cut )， 一 部 分 属于 U， 另 一 部 分 

属于 V。 一 个 端点 在 尽 中 ， 另 一 个 端点 在 和 中 的 边 的 数量 表示 切割 的 大 小 。 编 写 一 个 回 

测算 法 ， 寻 找 最 大 切割 的 大 小 和 相应 的 子 集 U。 确 定 算法 的 复杂 度 。 

[机 器 设计 ] 某 机 器 由 个 部 件 组 成 。 每 个 部 件 都 有 3 个 供应 处 。 令 wij 是 来 自 供应 处 7 的 

零件 i 的 重量 ,ci 则 为 该 零件 的 费用 。 编 写 一 个 回溯 算法 ， 找 出 耗费 不 超过 c、 重 量 最 轻 

的 机 器 构成 方案 。 算 法 的 复杂 度 是 多 少 ? 

21. [网络 设计 ] 一 个 原油 传输 网 络 可 用 一 个 加 权 有 向 无 环 图 G 表示 。G 有 一 个 称 为 始点 的 顶 
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点 s。 从 s 点 出 发 ,原油 流向 图 中 其 他 顶点 。s 的 人 度 为 0， 每 一 条 边 上 的 权 是 它 所 连接 的 
两 个 顶点 间 的 距离 。 随 着 原油 在 网 络 中 输送 ， 压 力 在 损失 ， 这 种 损失 是 输送 距离 的 函数 。 
为 了 保证 原油 在 网 络 中 正常 输送 ， 在 整个 网 络 中 必须 保证 最 小 压力 Pwis。 为 了 维持 最 小 压 
力 ， 可 在 图 G 的 一 部 分 或 全 部 顶点 上 放置 压力 放大 器 。 压 力 放大 器 可 将 压力 恢复 到 可 人 允 
许 的 最 大 量 级 Pasx。 令 d 为 原油 在 压力 Pn 降 为 Pmin 时 所 输送 的 距离 。 在 原油 无 压力 放 
大 具 时 所 输送 的 距离 不 超过 qd 的 条 件 下 ， 要 求 在 网 络 中 放置 最 少 的 放大 器 。 编 写 一 个 回 淹 
算法 来 求解 这 个 放大 器 放置 问题 。 算 法 的 复杂 度 是 多 少 ? 

[n 皇后 问题 ] 在 n 皇后 问题 中 ， 我 们 希望 在 nxn 的 棋盘 上 找到 个 皇后 的 放置 方法 ， 以 便 
任意 两 个 皇后 不 会 互相 攻击 。 当 且 仅 当 两 个 皇后 在 同一 行 ， 同 一 列 、 同 一 对 角 线 ， 或 反对 
角 线 上 时 ， 她 们 会 互相 攻击 。 假 定 在 任何 一 个 可 行 解 中 ， 皇 后 i 都 是 放置 在 棋盘 的 第 i 行 。 
所 以 我 们 只 决定 每 一 个 皇后 应 该 放置 在 哪 一 列 。 令 cj; 为 皇后 i 所 处 的 列 。 如 果 任 意 两 个 
皇后 不 神 突 ， 则 [cy,…,c4] 是 [1,2,…,n] 的 一 个 排列 。 因 此 ，n 皇后 问题 的 解 空间 被 限制 在 
[1,2,…,n] 的 所 有 排列 中 。 

1 ) 将 n 皇后 的 解 空间 组 织 成 一 棵 树 。 

2 ) 编写 一 个 回溯 算法 ， 搜 索 这 棵 树 ， 以 寻找 n 皇后 问题 的 可 行 排列 。 

编写 一 个 函数 ， 使 用 回溯 算法 搜索 一 个 二 叉子 集 空 间 树 。 其 参数 应 包含 如 下 函数 : 确定 一 
个 节点 是 否 可 行 ， 计 算 该 节点 的 界限 值 ， 确 定 这 个 界限 值 是 否 优 于 另 一 个 界限 值 等 。 把 它 
用 在 装载 和 0/1 背包 问题 上 来 测试 你 的 代码 。 


. 对 排列 空间 树 来 完成 练习 23。 
25. 


编写 一 个 函数 ， 用 回溯 法 搜索 一 个 解 空间 。 其 中 的 参数 应 包括 下 列 函数 : 产生 一 个 节点 的 
下 一 个 孩子 ,决定 下 一 个 孩子 是 否 是 可 行 的 ， 计 算 该 节点 的 界限 ， 确 定 该 界限 值 是 否 优 于 
男 一 个 界限 值 等 。 把 它 用 在 装载 和 0/1 背包 问题 上 来 测试 你 的 代码 。 
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概述 


任何 美好 的 事情 都 有 结束 的 时 候 。 这 是 书本 最 后 一 章 。 幸 运 的 是 ， 本 章 的 大 部 分 概念 在 
前 面 各 章 中 都 作 了 介绍 。 和 回溯 法 一 样 ， 分 支 定 界 法 也 经 常 把 解 空间 组 织 成 树 结构 然 后 进行 
搜索 。 常 用 的 树 结构 是 第 20 章 所 介绍 的 子 集 树 和 排列 树 。 与 回溯 法 不 同 的 是 ， 回 湖 法 使 用 深 
度 优先 方法 搜索 树 ， 而 分 支 定 界 法 一 般 用 广度 优先 或 最 小 耗费 方法 来 搜索 树 。 本 章 的 应 用 与 
第 20 章 的 完全 相同 ， 因 此 ， 可 以 很 容易 比较 回溯 法 与 分 支 定 界 法 的 异同 。 

相对 而 言 ， 分 支 定 界 法 的 空间 需求 比 回溯 法 要 大 得 多 ， 因 此 当 内 存 容量 有 限时 ， 回 溯 法 
常常 更 容易 成 功 。 


21.1 算法 思想 


分 支 定 界 ( branch and bound ) 是 另 一 种 系统 地 搜索 解 空间 的 方法 。 它 与 回 淹 法 的 主要 区 
别 在 于 E- 节 点 的 扩充 方式 。 每 个 活动 节点 仅 有 一 次 机 会 变 成 E- 节 点 。 当 一 个 节点 变 为 E- 节 
点 时 ， 从 该 节点 移动 一 步 即 可 到 达 的 节点 都 是 生成 的 新 节点 。 在 生成 的 节点 中 ， 那 些 不 可 能 
导出 ( 最 优 ) 可 行 解 的 节点 被 舍弃 (成 为 “ 死 ” 节点 )， 剩余 节点 加 入 活动 节点 表 ， 然 后 从 表 
中 选择 一 个 节点 作为 下 一 个 E- 节 点 。 将 选择 的 节点 从 表 中 删除 ， 然 后 扩展 。 这 种 扩展 过 程 一 
直 持 续 到 一 个 解 找到 了 或 活动 表 成 为 空 表 。 

有 两 种 常用 的 方法 可 用 来 选择 下 一 个 E- 节 点 (虽然 也 可 能 存在 其 他 的 方法 ): 

e 先进 先 出 (FIFO ) 

从 活动 节点 表 中 取出 节点 的 顺序 与 加 入 节点 的 顺序 相同 。 活动 节 点 表 与 队列 相同 。 

e 最 小 耗费 或 最 大 收益 法 

每 个 节点 都 有 一 个 对 应 的 耗费 或 收益 。 若 搜索 的 是 耗费 最 小 的 解 ， 则 活动 节点 表 可 以 组 
织 成 小 根 堆 ， 下 一 个 E- 节 点 是 耗费 最 小 的 活动 节点 。 若 需要 的 是 收益 最 大 的 解 ， 那 么 活动 节 
点 表 可 以 组 织 成 大 根 堆 ， 下 一 个 下 -节点 是 收益 最 大 的 活动 节点 。 

例 21-1[ 迷宫 老 鼠 ] 考察 图 20-3a 的 迷宫 老鼠 实例 和 图 20-1 的 解 空间 结构 。 使 用 FIFO 
分 支 定 界 ， 初 始 时 (1,1) 为 E- 节 点 且 活 动 队列 为 
空 。 把 迷宫 位 置 (1,1) 置 为 1， 以 免 重 回 这 个 位 1 1 1 
置 。 把 (1,1) 扩展 ， 把 它 的 相 邻 节点 (L2) 和 66 
(2,1 ) 加 入 队列 〈“ 即 活动 节点 表 )。 为 避免 重 回 到 这 a) b) c) 
两 个 位 置 ， 将 (1,2) 和 (2,1) 置 为 1。 此 时 迷宫 如 图 21-1 迷宫 问题 的 FIFO 分 支 定 界 方法 
图 21-1a 所 示 ， 而 且 E- 节 点 ( 1,1 ) 被 舍弃 。 

把 节点 (12 ) 从 队列 中 取出 ， 并 扩展 。 检 查 它 的 三 个 相 邻 节点 ( 见 图 20-1 的 解 空 间 )， 
只 有 (1,3) 是 可 行 的 节点 ( 其 余 两 个 节点 都 是 障碍 节点 )， 因 此 将 其 加 入 队列 ， 并 把 相应 位 
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置 (1.3) 置 为 1， 所 得 到 的 迷宫 状态 如 图 21-1b 所 示 。 节 点 (1,2) 被 舍弃 。 把 下 一 个 E- 节 
点 (2,1) 从 队列 中 取出 ， 并 扩展 。 把 节点 (3,1 ) 加 入 队列 ， 并 把 相应 位 置 (3,1 ) 置 为 1， 节 
点 (2,1 ) 被 舍弃 ， 所 得 到 的 迷宫 如 图 21-1ec 所 示 。 此 时 队列 包含 (13 ) 和 (3,1 ) 两 个 节点 。 
随后 节点 ( 1,3 ) 变 成 下 一 个 E- 节 点 ， 由 于 此 节点 不 能 到 达 任 何 新 的 节点 ， 所 以 被 舍弃 。 节 点 
( 3,1 ) 成 为 新 的 E- 节 点 ， 这 时 队列 已 室 。 扩 展 节 点 (3,1), 把 (3,2) 加 入 队列 , 把 (3,1 ) 售 
弃 。( 3,2 ) 变 为 新 的 E- 节 点 ,并 扩展 。 扩 展 后 到 达 节 点 ( 3,3 )， 搜 索 终 止 。 

使 用 FIFO 搜索 迷宫 时 ， 所 找到 的 路 径 ( 如果 存 在 的 话 ) 一 定 是 从 入 口 到 出 口 的 最 短路 
径 。 而 用 回溯 法 找到 的 路 径 却 不 一 定 是 最 短路 径 。 有 趣 的 是 ， 我 们 已 经 见 过 用 来 搜索 迷宫 的 
FIFO 分 支 定 界 法 代码 。 电 路 布线 的 最 短路 径 程序 9-8 便 是 如 此 ， 它 利用 FIFO 分 支 定 界 来 确 
定 从 迷宫 的 (1,1 ) 到 (n,n ) 的 最 短路 径 。 加 

例 21-2[0/1 背包 问题 ] 已 知 一 个 背包 问题 实例 : n=3, w=[20,15,15],，p=[40,25,25]， 
c=30。 我 们 将 用 FIFO 分 支 定 界 和 最 大 收益 分 支 定 界 来 解决 这 个 问题 。FIFO 分 支 定 界 用 一 个 
队列 来 记录 活动 节点 ，E- 节 点 按照 FIFO 顺序 从 队列 中 取出 ; 而 最 大 收益 分 支 定 界 用 一 个 最 大 
堆 记 录 活 动 节 点 ，E- 节 点 按照 每 个 活动 节点 收益 值 的 递减 顺序 ， 或 按照 活动 节点 子 树 中 任意 
叶 革 点 的 收益 估计 值 的 递减 顺序 从 堆 中 取出 。 本 例 与 例 20-2 相同 ， 解 空间 树 与 图 20-2 一 样 。 

FIFO 分 支 定 界 法 搜索 以 根 节点 A 作为 起 始 时 的 E- 节 点 ， 此 时 的 活动 节点 队列 为 空 。 当 
节点 A 扩展 时 ， 生 成 节点 B 和 C。 由 于 这 两 个 节点 都 是 可 行 的 ， 所 以 都 加 入 到 活动 节点 队 
列 ， 节 点 A 被 舍弃 。 下 一 个 E- 节 点 是 B， 它 扩展 后 生成 节点 D 和 E, D 是 不 可 行 的 ， 被 舍弃 ， 
而 下 加 入 队列 。 接 下 来 节点 C 成 为 E- 节 点 ， 它 扩展 后 生成 节点 F 和 G， 两 者 都 是 可 行 节点 ， 
因此 都 加 入 队列 。 下 一 个 E- 节 点 是 E， 生 成 节点 J 和 KK， J 不 可 行 而 被 舍 充 ，K 是 可 行 的 叶 节 
点 ， 并 表示 一 个 可 行 的 解 ， 收 益 值 为 40。 

下 一 个 E- 节 点 是 F， 它 扩展 后 生成 站 和 Me。 EL 代表 一 个 可 行 的 解 且 收 益 值 为 50， 而 M 
代表 男 一 个 收益 值 为 15 的 可 行 解 。G 是 最 后 一 个 E- 节点 ， 它 的 孩子 N 和 0O 都 是 可 行 的 。 现 
在 活动 节点 队列 变 为 空 ， 搜 索 过 程 终止 。 最 佳 解 的 收益 值 为 50。 

解 空间 树 的 FIFO 分 支 定 界 搜 索 与 广度 优先 搜索 很 相似 。 它 们 的 主要 区 别 是 前 者 不 搜索 
不 可 行 节点 的 子 树 。 

最 大 收益 分 支 定 界 算法 以 解 空间 树 的 节点 A 作为 初始 E- 节 点 。 活 动 节点 的 最 大 堆 初 始 为 
空 。 扩 展 初始 E- 节 点 A 得 到 节点 B 和 C， 两 者 都 是 可 行 节点 ， 因 此 插入 堆 。 节 点 B 的 收益 
值 是 40 ( 设 xi=l )， 而 节点 C 的 收益 值 为 0。A 被 舍弃 ，B 成 为 下 一 个 E- 节 点 ， 因 为 它 的 收 
益 值 比 C 的 大 。 扩 展 节点 B 得 到 节点 D 和 E, D 是 不 可 行 的 ， 因 而 被 舍弃 把 EE 加 入 堆 。E 
的 收益 值 为 40， 而 C 的 收益 值 为 0， 因 此 EE 成 为 下 一 个 E- 节 点 。 扩 展 E 节 点 生成 节点 J 和 
K, J 不 可 行 而 被 舍弃 ，K 代表 一 个 可 行 的 解 。 这 个 解 作为 目前 最 优 解 被 记录 下 来 ,然后 KK 被 
舍弃 。 现 在 堆 中 只 剩 下 一 个 活 节点 C， 因 此 C 作为 E- 节 点 而 扩展 ， 生 成 F、G 两 个 节点 ,并 
插入 堆 中 。F 的 收益 值 为 25， 成 为 下 一 个 E- 节 点 ， 扩 展 后 得 到 节点 L 和 M， 但 站 、M 都 被 舍 
弃 ， 因 为 它们 是 叶 节 点 。 与 对 应 的 解 作 为 当前 最 优 解 记录 下 来 。 最 后 ，G 成 为 E- 节 点 ， 生 
成 节点 为 N 和 O， 两 者 都 是 叶 节 点 而 被 舍弃 。 两 者 所 对 应 的 解 都 不 优 于 当前 最 优 解 ， 因 此 最 
优 解 保持 不 变 。 此 时 堆 变 成 空 ， 搜 索 过 程 终止 ，L 表示 的 解 是 最 优 解 。 

如 同 回 漳 法 一 样 ， 利 用 一 个 定 界 函 数 可 以 加 速 最 优 解 的 搜索 过 程 。 定 界 函 数 为 最 大 收益 
设置 了 一 个 上 限 ( 这 个 最 大 收益 是 通过 一 个 特定 节点 的 扩展 而 得 到 )。 一 个 节点 ， 若 其 定 界 函 
数值 不 大 于 目前 最 优 解 的 收益 值 ， 则 被 舍弃 ， 不 作 扩 展 。 我 们 用 最 大 收益 分 支 定 界 方法 从 堆 
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中 提取 节点 时 ， 不 是 根据 节点 的 实际 收益 值 ， 而 是 按照 收益 定 界 函数 值 的 非 递 增 顺 序 。 这 种 
策略 所 优先 考虑 的 是 有 可 能 到 达 一 个 含有 最 优 解 的 叶 节 点 的 活动 节点 ， 而 不 是 目前 具有 较 大 
收益 值 的 节点 。 国 

例 21-3[ 旅行 商 问 题 ] 考虑 图 20-4 的 四 城市 旅行 商 问题 ， 其 解 空间 的 组 织 结构 是 
图 20-5 所 示 的 排列 树 。FIFO 分 支 定 界 算法 在 初始 时 的 E- 节点 是 节点 B， 活 动 节点 队列 为 空 。 
当 B 扩展 时 ， 生 成 节点 C、D 和 E。 由 于 从 顶点 1 到 顶点 2、3、4 的 每 一 个 顶点 都 有 边 ， 所 
以 节点 C、D、E 都 是 可 行 的 ， 并 加 入 队列 中 。 当 前 的 E- 节 点 B 被 舍弃 ， 下 一 个 E- 节 点 是 队 
列 中 的 第 一 个 活动 节点 C。 扩 展 节 点 C， 生 成 节点 F 和 G。 把 它们 加 入 队列 ， 因 为 在 图 20-4 
中 ， 从 顶点 2 到 顶点 3 和 4 都 有 边 。 接 下 来 D 成 为 E- 节 点 ， 然 后 E 成 为 E- 节 点 。 现 在 ， 活 
动 节点 队列 包含 节点 F 到 K。 

下 一 个 E- 节 点 是 F， 扩 展 后 得 到 了 叶 节 点 L。 一 个 旅行 路 径 找到 。 它 的 费用 是 59。 扩 
展 下 一 个 E- 节 点 G， 得 到 叶 节 点 M， 它 对 应 一 个 费用 为 66 的 旅行 路 径 。 接 下 来 节点 匡 成 为 


E- 节 点 ， 由 此 得 到 叶 节 点 N， 对 应 一 个 费用 为 25 的 旅行 路 径 。 下 一 个 E- 节 点 是 I， 它 对 应 的 
部 分 旅行 1、3、4 其 开销 已 经 为 26， 超 过 目前 最 优 旅 行 的 费用 ， 因 此 ,I 不 扩展 。 最 后 ， 节 


点 和 相继 成 为 E- 节 点 ， 然 后 扩展 。 这 时 队列 成 空 ， 算 法 结束 。 最 优 方案 是 由 节点 N 所 确 
定 的 旅行 路 径 . 

可 以 不 使 用 FIFO 方法， 而 使 用 最 小 耗费 方法 来 搜索 解 空 间 树 ， 用 一 个 最 小 堆 来 存储 活 
动 节点 。 在 搜索 起 始 时 ， 也 是 节点 B 作为 E- 节 点 ， 活 动 节点 列表 为 空 。 当 扩展 节点 B 时 ， 生 
成 节点 C、D 和 下 ， 并 将 它们 加 入 小 根 扒 。 在 小 根 推 中,，E 耗费 最 小 ( 因为 部 分 旅行 路 径 1、 
4 的 耗费 是 4)， 因 此 下 成 为 E- 节 点 。 扩 展 E， 生 成 节点 J 和 开 ， 并 将 它们 加 入 小 根 堆 。 这 两 
个 节点 的 耗费 分 别 为 14 和 24。 此 时 在 小 根 堆 中 ，D 的 耗费 最 小 ， 因 而 D 成 为 E- 节 点 ， 并 生 
成 节点 下 和 1I。 至 此 ， 最 小 堆 包 含 节点 C、H、I、J 和 开 ， 其 中 理 的 耗费 最 小 ， 因 此 成 为 
下 一 个 E- 节 点 。 扩 展 节点 EE， 得 到 一 个 完整 的 旅程 1、3、2、4、1， 耗 费 是 25。 节 点 J 是 下 


一 个 E- 节 点 ， 扩 展 它 得 到 节点 P， 它 对 应 一 个 耗费 25 的 旅行 路 径 。 节 点 K 和 1 是 下 两 个 E- 
节点 。 由 于 工 的 耗费 超过 了 当前 最 优 旅行 的 耗费 ， 因 此 搜索 结束 ; 剩 下 的 所 有 活动 节点 都 不 


能 使 我 们 得 到 更 优 的 解 。 

对 于 例 21-2 的 背包 问题 实例 ， 可 以 使 用 一 个 定 界 函数 来 减少 生成 和 扩展 的 节点 数量 。 这 
种 函数 可 以 确定 旅行 的 最 小 耗费 的 下 限 ， 这 个 下 限 可 通过 某 个 节点 的 扩展 得 到 。 如 果 一 个 节 
点 的 定 界 函数 值 不 能 比 当 前 最 优 旅 行 的 耗费 更 小 ， 那 么 可 以 把 它 舍弃 而 不 用 扩展 。 另 外 ， 在 
最 小 耗费 分 支 定 界 搜索 中 ， 我 们 按照 耗费 的 非 递 减 顺 序 从 小 根 堆 中 提取 节点 。 

如 在 以 上 儿 个 实例 中 所 述 ， 利 用 定 界 函数 可 以 降低 解 空间 树 中 生成 的 节点 数目 。 但 是 设 
计 定 界 函 数 时 必须 记 住 ,我们 的 主要 目的 是 用 最 少 的 时 间 ， 在 内 存 允 许 的 范围 内 去 解决 问题 。 
生成 最 少 的 节点 来 解决 问题 并 不 是 我 们 的 根本 追求 。 我 们 需要 的 定 界 函 数 是 以 减少 生成 节点 
的 数量 为 手段 ， 以 最 大 限度 地 减少 计算 时 间 为 目标 的 定 界 函 数 。 

一 般 来 说 ， 在 内 存 利用 效率 方面 ， 回 济 法 优 于 分 支 定 界 法 。 回 溯 法 需要 的 内 存 是 O( 解 空 
间 的 最 长 路 径 长 度 )， 而 分 支 定 界 所 占用 的 内 存 为 O( 解 空 间 大 小 )。 对 于 一 个 子 集 空间 ， 回 
溯 法 需要 O(n) 的 内 存 ， 而 分 支 定 界 需要 0(2”) 的 内 存 。 对 于 排列 空间 ， 回 溯 需 要 B(n) 的 内 
存 ， 分 支 定 界 需要 O(n!) 的 空间 。 虽 然 最 大 收益 ( 或 最 小 耗费 ) 分 支 定 界 在 直觉 上 要 好 于 回 
漳 法 ， 而 且 检查 的 节点 也 更 少 ， 但 在 实际 应 用 中 , 在 回溯 法 还 没有 超出 时 间 的 上 限 之 前 ， 分 
支 定 界 已 经 超出 了 内 存 的 上 限 . 
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练习 


1. 假定 在 一 个 LIFO 分 支 定 界 搜索 中 ， 活 动 节点 列表 相当 于 栈 。 描 述 这 种 算法 在 处 理 例 21-2 

的 背包 问题 时 的 过 程 。 这 种 方法 与 回溯 法 有 什么 不 同 ? 

2. 已 知 0/1 背包 问题 实例 如 下 : n=4, p=[4,3,2,1],，w=[1,2,3,4]，c=6。 

1 ) 画 出 这 个 背包 问题 的 解 空间 树 。 

2 ) 像 例 21-2 那样 ， 描 述 FIFO 分 支 定 界 法 在 解决 上 述 问 题 时 的 过 程 。 

3 ) 使 用 定 界 函数 ( 程序 20-9 ) 来 计算 子 树 上 任 一 叶 节 点 可 能 获得 的 最 大 收益 值 。 使 用 这 
个 定 界 函数 和 当前 最 优 解 的 值 来 决定 是 否 将 一 个 节点 加 和 人 活动 节点 列表 中 。 解 空间 树 中 
哪些 节点 是 使 用 以 上 机 制 的 FIFO 分 支 定 界 方法 产生 的 ? 

4) 像 例 21-2 那样 ,描述 用 最 大 收益 分 支 定 界 法 解决 上 述 问题 的 过 程 。 

5 ) 若 最 大 收益 分 支 定 界 算法 使 用 3 ) 中 的 定 界 函数 ， 将 生成 解 空 间 树 中 的 哪些 节点 ? 


21.2 应 用 
21.2.1 ” 货 箱 装载 


1. FIFO 分 支 定 界 

20.2.1 节 的 货 箱 装载 问题 实质 上 是 寻找 第 一 条 船 的 最 大 装载 方案 。 这 是 一 个 子 集 选 择 问 
题 ， 它 的 解 空间 被 组 织 成 子 集 树 。 程 序 21-1 类 似 于 程序 20-1 的 FIFO 分 支 定 界 。 像 程序 20-1 
一 样 ， 程 序 21-1 只 是 寻找 最 大 装载 的 重量 。 


程序 21-1 货 箱 装载 问题 的 FIFO 分 支 定 界 算法 

int maxLoading (int *weight, int theNumberOfContainers, int capacity) 
{// 用 FIFO 分 支 定 界 搜索 解 空间 
1/ 数 组 weight[1:theNumberOfContainers] = 货 箱 重量 
/变量 capacity = 船 装载 量 
/返回 最 优 装载 重量 ， 

/ 初始 化 全 局 变量 

numberOfContainers = theNumberOfContainers; 

maxWeightSoFar = 0; 

liveNodeQueue.push (-1); 1/ 层 结束 标志 


1/ 初始 化 1 层 中 的 也- 节点 
int eNodeLevel = 1; 
int eNodeWeight = 0; 


1/ 搜索 子 集 空间 树 
while (true) 
{ 
// 检查 EE- 节点 的 左 孩 子 
if (eNodeWeight + weight[eNodeLevel] <= capacity) 
1/ 左 孩子 


addLiveNode (eNodeWeight + weight[eNodeLevel], eNodeLevel); 


1/ 右 孩子 总 是 可 行 的 
addLiveNode (eNodeWeight, eNodeLevel).: 


/取得 下 一 个 了- 节点 
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eNodeWeight = liveNodeQueue.front 1() 
liveNodeQueue.pop (); 
if (eNodeWeight == -1) 
{1/ 野 结束 
if (liveNodeQueue .empty()) // 没有 活动 节点 
return maxWeightSoFar; 
liveNodeQueue .push (-1); 1/ 层 结束 标志 
/取得 下 一 个 E- 节 点 
eNodeWeight = liveNodeQueue.front ()， 


Bh 


liveNodeQueue .pop (); 
eNodeLevel++; 
} 


void addLiveNode (int theweight, int theLevel) 
{1/ 把 其 权 值 等 于 theWweight 的 节点 ( 如果 不 是 叶 节 点 ) 加 到 活动 节点 队列 


if (theLevel == numberOfContainers) 
{VW/ 可 行 的 叶 节 点 
if (theWeight > maxWeightSoFar) /达到 更 优 的 叶 节 点 


maxWeightSoFar = theweight; 


1 
了 
else /不 是 叶 节 点 
liveNodeQueue.push (thewWeight); 
} 





函数 maxLoading 对 解 空 间 树 进行 FIFO 分 支 定 界 搜索 ， 用 队列 liveNodeQueue 保存 活动 
节点 权 值 。 队 列 还 用 -1 标志 每 一 层 的 活动 节点 的 结尾 。 函 数 addLiveNode 把 节点 ( 即 节 点 
的 权 值 ) 加 入 到 活动 节点 队列 。 对 要 加 入 队列 的 节点 ， 函 数 addLiveNode 首先 检验 该 节点 是 
和 否 等 于 货 箱 的 数量 。 若 相等 ， 则 已 达到 时 节点 。 叶 节点 不 加 入 队列 ， 因 为 它们 不 展开 。 每 个 
到 达 的 叶 节 点 都 确定 了 一 个 可 行 的 解 ， 我 们 把 每 个 可 行 解 都 与 目前 最 优 解 比较 ， 以 确定 最 优 。 
把 非 叶 节 点 的 权 加 入 队列 。 

函数 maxLoading 首先 初始 化 eNodeLevel=1( 当前 E- 节 点 是 根 节 点 )，maxWeightSoFar=0 
( 目前 最 优 装 载 的 值 )。 此 时 ， 活 动 节点 队列 为 空 。 下 一 步 , 把 -1 加 入 队列 以 说 明 我 们 正 处 
在 第 一 层 的 末尾 。 在 while 循环 中 ， 首 先 检查 E- 节 点 的 左 孩 子 是 否 可 行 。 如 果 可 行 ， 则 调用 
addLiveNode, 然后 将 右 孩 子 加 入 队列 ( 此 节点 必定 是 可 行 的 )。 

如 果 了 -节点 的 两 个 孩子 都 已 生成 ， 则 舍弃 该 E- 节 点 ， 并 从 队列 中 取出 下 一 个 E- 节 点 。 
此 时 队列 不 为 空 ， 因 为 至 少 含有 本 层 结 尾 的 标志 -1。 如 果 到 达 一 层 的 结尾 ， 则 查看 下 一 层 是 
否 有 活动 节点 。 当 且 仅 当 队 列 不 为 空 时 ， 下 一 层 就 有 活动 节点 。 若 下 一 层 存在 活动 节点 ， 则 
把 下 一 层 的 结束 标志 加 入 队列 ， 并 开始 处 理 下 一 层 的 活动 节点 。 

maxLoading 陋 数 的 时 间 和 空间 复杂 度 都 是 O(27)。 

2. 改进 

我 们 可 以 改进 程序 20-2: 只 有 当 右 孩子 对 应 的 重量 加 上 剩余 货 箱 的 重量 ( remainingWeight ) 
超出 maxWeightSoFar 时 ， 才 选择 右 孩 子 。 在 程序 21-1 中 ，maxWeightSoFar 直到 eNodeLevel 
等 于 numberOfContainers 时 才 更 新 。 在 此 之 前 ， 对 右 孩 子 的 测试 总 是 成 功 的 ， 因 为 
maxWeightSoFar=0 日 remainingWeight>0。 当 eNodeLevel 等 于 numberOfContainers 时 ， 不 会 
再 有 节点 加 入 队列 。 因 此 这 时 不 再 需要 测试 右 孩 子 。 
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为 了 使 右 孩 子 的 测试 有 效 ， 需 要 提前 更 新 maxWeightSoFar 的 值 。 我 们 知道 ， 最 优 装 载 
的 重量 是 子 集 树 中 可 行 节点 的 重量 的 最 大 值 。 由 于 仅 在 向 左 孩 子 移动 时 ， 这 些 重量 才 会 增 大 ， 
所 以 可 在 这 种 移动 时 改变 maxWeightSoFar 的 值 。 根 据 这 种 观察 ,我们 设计 了 程序 21-2。 当 一 
个 活动 节点 加 入 队列 时 ，theWeight 不 会 超过 maxWeightSoFar， 因 此 maxWeightSoFar 没有 更 
新 。 现 在 我 们 可 以 用 一 条 直接 插入 maxLoading 的 语句 取代 函数 addLiveNode。 


程序 21-2 ”对 程序 21-1 的 改进 


int maxLoading (int *weight, int theNumberofContainers, int capacity) 
{// 用 FIFO 分 支 定 界 搜索 解 空间 
/数组 weight[l:theNumberOofContainers]j = 货 箱 重量 
/变量 capacity = 船 装 载 量 
1/ 返回 最 优 装载 重量 
/ 初始 化 全 局 变量 
numberOfContainers = theNumberOfContainers; 
maxWeightSoFar = 0; 
liveNodeQueue.push (-1); 1/ 是 结 束 标志 


1/ 初始 化 1 层 中 的 瑟 - 节 点 

int eNodeLevel = 1; 

int eNodeWeight = 0; 

int remainingWeight = 0; 

for (int J = 2; 3 <= numberOfContainers; j++) 
remainingWeight += weight{[j]; 


1/ 搜索 子 空间 树 
while (true) 
{ 
// 检查 下 -节点 的 左 孩 子 
int leftChildWeight = eNodeWeight + weight[eNodeLevell]; 
if (leftCchildWeight <= capacity) ” 
{W 可 行 的 左 孩 子 节点 
if (leftchildweight > maxWeightSoFar) 
maxWeightSorar = LeftChilaWeighty 
/ 如 非 叶子 节点 ， 加 入 队列 
if (eNodeLevel < numberofContainers) 
liveNodeQueue.push (leftChildWeight); 
} 


/ 检查 右 孩 子 节点 

if (eNodeWeight + remainingWeight > maxWeightSorFar 
&& eNodeLevel < numberOfContainers) 
1/ 右 孩 子 节点 可 以 通 向 更 好 的 叶 节 点 
liveNodeQueue.push (eNodeWeight); 

/ 取 下 一 个 也 -节点 

eNodeWeight = liveNodeQueue.front(); 

liveNodeQueue .pop(); 


if (eNodeWeight == -1) 
{1/ 层 的 结尾 
if (liveNodeQueue.empty ()) /不 再 有 活动 节点 
return maxWeightSoFar; 
liveNodeQueue.push (-1); / 层 的 结束 标志 
1/ 取 下 一 个 EE- 节 点 
eNodeWeight = liveNodeQueue.front(); 


liveNodeQueue .pop (); 
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eNodeLevelt++; 
remainingWeight -= weight [eNodeLevel]; 





3. 寻找 最 优 子 集 

为 了 找到 最 优 子 集 ， 需 要 存储 从 活动 节点 到 根 节 点 的 路 径 。 这 样 一 来 ， 在 找到 最 优 装 载 
所 对 应 的 叶 而 点 之 后 ， 就 可 以 沿 着 至 根 节 点 的 路 径 设置 x 的 值 。 我 们 需要 把 活动 节点 队列 中 
Wp 改变 为 qNode 类 型 。 其 中 qNode 包含 数据 成 员 parent ( 指向 解 空间 树 中 父 

节点 的 指针 )，leftChild 当日 仅 当 节点 是 其 父 节 点 的 左 孩 子 时 ， 其 值 为 true )，weight ( 在 该 
节点 的 部 分 装载 重量 )。 这 个 新 的 分 支 定 界 代码 见 程序 21.3。 


程序 21-3 ”计算 最 优 子 集 的 分 支 定 界 代 码 


int maxLoading (int *weight, int theNumberOfContainers, int capacity, 
int *theBestLoading) 
{// 用 FIFO 分 支 定 界 法 搜索 解 空间 
1// 数组 weight[1:theNumberOfContainers] = 货 箱 重量 
// 变量 capacity = 船 装载 量 
1/ 数组 theBestLoading[1:theNumberOfContainers] 是 最 优 装载 
// 返回 最 优 装载 重量 。 
/初始 化 全 局 变量 
numberOfContainers = theNumberOfContainers; 
maxWeightSsoFar = 0; 
liveNodeQueue.push (NULL); 1/ 层 结束 标志 
dNode *eNode = NULL; 
bestENodeSoFar = NULL; 
bestLoading = theBestLoading; 





1/ 初始 台 化 层 中 的 EE- 节点 

int eNodeLevel = 1; 

int eNodeWeight = 0; 

int remainingWeight = 0; 

for (int jj = 2; j <= numberOfContainers; j++) 
remainingWeight += weight[j]; 


// 搜索 子 空间 树 
while (true) 
{ 
// 检查 也 -节点 的 左 和 孩子 
int leftchildWeight = eNodeWeight + weight[eNodeLevell]; 
if (leftChildWeight <= capacity) 
{/ 可行 的 左 孩 子 节点 
if (leftChildWeight > maxWeightSoFar) 
maxWeightSoFar = leftChildWeight; 
addLiveNode (leftchildWeight, eNodeLevel, eNode, true); 


// 检查 右 孩 子 节点 
if (eNodeWeight + remainingWeight > maxWeightSoFar) 
addLiveNode (eNodeWeight, eNodeLevel, eNode., false); 


eNode = liveNodeQueue.front () 
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1iveNodecueue .pop () 


if (eNode == NULL) 

{1/ 层 的 结尾 
if (liveNodeQueue.empty()) break; /没有 活动 节点 
1iveNodeoueue .push (NULL); // 层 结尾 的 指针 
eNode = liveNodeQueue.front (); 


liveNodeQueue .Pop ()，; 
eNodeLevel++; 
remainingWeight -= weight[eNodeLevell]; 


} 


eNodeWeight = eNode->weight; 

} 

// 沿 着 从 bestENodeSoFar 到 根 的 路 径 生成 bestLoading[] 

/用 addLiveNode 设置 bestLoading[numberOfContainers] 

for (int j = numberOfContainers - 1; ] > 0; j--) 

{ 
bestLoading[j] (bestENodeSoFar->leftChild) ? 1 : 0: 
bestENodeSoFar = bestENodeSoFar->parent; 

} 


return maxWeightSoFar; 


ll 


} 


void addLiveNode (int theWeight, int theLevel, 

gqNode* theParent, bool leftChild) 
{1/ 把 theLevel 层 中 且 重 量 为 theWeight 的 一 个 节点 ( 非 叶 节 点 ) 
1/ 加 到 活动 节点 队列 。 若是 可 行 的 叶 节 点 ， 则 
/bestLoading[numberOfContainers] = 1 当 自 仅 当 leftchild 的 值 为 true 
//theParent = 新 节点 的 父 节点 
1 leftchild 为 true 当 且 仅 当 新 节点 是 theParent 的 左 孩 子 


IE (theLevel == numberOfContainers) 
{W 可 行 的 叶 节 点 
if (theWeight == maxWeightSoFar) 


{1/ 当前 最 优 叶 节点 
bestENodeSoFar = thePparent; 
bestLoading[numberOfContainers] = (leftChild) ? 1 : 0; 
} 
return’; 


} 

1/ 不 是 一 个 叶 节点 ， 加 入 队列 

GNode *b = new qNode (thePatent， leftChild, theWeight); 
liveNodeQueue.push (b) : 





4. 最 大 收益 分 支 定 界 


在 对 子 集 树 进行 最 大 收益 分 支 定 界 搜索 时 ， 活 动 节 点 列表 是 一 个 最 大 优先 级 队列 。 其 中 
队列 中 的 每 个 活动 节点 x 都 有 一 个 相应 的 重量 上 限 ( 或 最 大 收益 )。 这 个 重量 上 限 是 节点 x 的 
重量 加 上 剩余 货 箱 的 重量 。 活 动 节点 按 其 重量 上 限 的 递减 顺序 成 为 E- 节 点 。 注 意 ， 若 节点 x 
的 重量 上 限 是 x.upperWeight， 则 其 子 树 中 不 可 能 存在 重量 超过 x.upperWeight 的 节点 。 另 外 ， 
与 一 个 叶 节 点 相应 的 重量 等 于 其 重量 上 限 ， 据 此 我 们 得 出 结论 ， 在 最 大 收益 分 支 定 界 算法 中 ， 
当 一 个 叶 节 点 成 为 E- 节 点 时 ， 沿 剩余 活动 节点 不 可 能 到 达 具 有 更 大 重量 的 叶 节 点 。 因 此 可 以 


终止 最 优 装载 的 搜索 。 
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上 上 述 策略 可 以 用 两 种 方法 来 实现 。 在 第 一 种 方法 中 ， 每 一 个 活动 节点 都 单独 存储 在 最 大 
优先 级 队列 。 这 时 ， 每 个 活动 节点 必须 包含 从 子 集 树 的 根 到 该 节点 的 路 径 信息 。 一 旦 找到 产 
生 最 优 装 载 的 叶 节 点 ， 就 利用 这 个 路 径 信息 来 计算 x 值 。 在 第 二 种 方法 中 ， 除 了 把 每 一 个 活 
动 节点 加 入 最 大 优先 级 队列 以 外 ， 还 必须 把 该 节点 放 在 另 一 个 树 结 构 中 ， 这 个 树 结构 表示 生 
成 的 子 集 树 部 分 。 当 找到 最 优 叶 节点 时 ， 就 可 以 沿 着 从 该 叶 节 点 到 根 的 路 径 来 计算 出 x 值 。 
本 章 使 用 第 二 种 方法 ， 把 第 一 种 方法 留 作 习题 5。 

用 类 型 为 bbNode 的 节点 来 表示 解 空间 树 。 这 种 类 型 的 节点 有 parent 域 (指向 解 空间 树 
的 父 节点 指针 ) 和 leftChild 域 ( 当 且 仅 当 该 节点 是 其 父 节 点 的 左 孩 子 时 ， 其 值 为 true )。 

优先 级 队列 可 以 用 大 根 堆 来 表示 。 大 根 堆 的 元 素 类 型 为 heapNode。heapNode 的 每 一 个 实 
例 包 含 数据 域 liveNode ( 解 空间 树 的 节点 p 的 一 个 指针 ， 节 点 p 用 堆 节 点 表示 )，upperWeight 
(节点 p 的 重量 上 限 ) 和 1level (节点 p 所 在 层 )。 结 构 heapNode 用 upperWeight 域 定义 了 一 个 
向 整 型 的 类 型 转换 。 

函数 addLiveNode ( 见 程序 21-4 ) 用 bbNode 类 型 的 节点 ， 把 活动 节点 加 到 子 集 树 中 ; 用 
heapNode 类 型 的 节点 ， 把 相应 的 节点 插入 大 根 堆 。 


程序 21-4 最 大 收益 分 支 定 界 装 载 的 addLiveNode 函数 
void addLiveNode (int upperWeight, int level, 
bbNode* theParent, bool leftChild) 

{1/ 把 一 个 新 的 活动 节点 加 到 活动 节点 大 根 堆 和 解 空间 树 
1// theParent 是 新 活动 节点 的 父 节 点 
1/leftchild 是 true， 当 上 且 仅 当 这 个 新 活动 节点 是 其 父 节 点 的 左 孩 子 

/生成 解 空间 推 的 这 个 新 节点 

bbNode* b = new bbNode (theParent, leftChild); 


1/ 把 相应 的 堆 节 点 插入 大 根 堆 
liveNodeMaxHeap.push (heapNode (b, upperWeight, level)); 
} 





函数 maxloading ( 见 程 序 21-5 ) 从 解 空间 树 的 根 节点 开始 ， 实 施 最 大 收益 分 支 定 界 搜索 。 
while 循环 产生 当前 E- 节 点 的 左右 孩子 。 如 果 左 孩子 是 可 行 的 ( 即 它 的 重量 没有 超出 容量 )， 
那么 将 它 加 入 子 集 树 中 并 作为 一 个 第 eNodeLevel+1 层 节 点 加 入 大 根 堆 。 一 个 可 行 的 节点 的 右 
孩子 肯定 是 可 行 的 ， 因 此 它 总 是 加 入 子 树 和 大 根 堆 中 。 完 成 插入 操作 之 后 ， 从 大 根 堆 中 取出 
下 一 个 了- 节 点。 如果 下 一 个 E- 节 点 是 叶 节 点 ， 则 它 代 表 最 优 装 载 。 沿 着 从 该 叶 节 点 到 根 的 路 
径 可 以 得 到 这 个 最 优 装 载 。 


程序 21-5 ”装载 问题 的 最 大 收益 分 支 定 界 法 


int maxLoading (int *weight, int numberOfContainers, int capacity, 
int *bestLoading) 
{/ 用 最 大 收益 分 支 定 界 法 搜索 解 空间 
// 数 组 weight[l:numberOfContainers] = 货 箱 重量 
// 变量 capacity = 船 装 载 量 
// 数组 bestLoading[1:numberOfContainers] 是 最 优 装载 
// 返回 最 优 装 载重 量 
/ 初始 化 层 1 的 EE- 节 点 
bbNode* eNode = NULL; 
int eNodeLevel = 1; 
int eNodeWeight = 0; 
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1/remainingWeight[j] 是 weight[j+1:n] 的 和 
int *remainingWeight = new int [numberOfContainers + 1]; 


remainingWeight [numberOfContainers] = 0; 
for (int j = numberOfContainers - 1; jj > 0; j--) 
remainingWeight[j] = remainingWeight[] + 1] + weight[j + 1]; 


// 搜索 子 集 空间 树 
while (eNodqeLevel != numberOfContainers + 1) 
{1/ 不 在 叶 节 点 
// 检查 下 -节点 的 孩子 
if (eNodeWeight + weight[eNodeLevel] <= capacity) 
// 可 行 左 孩子 
addLiveNode (eNodeWeight + weight[eNodeLevel] + 
remainingWeight[eNodeLevell], eNodeLevel + 1, 
eNode, true); 
// 右 孩子 总 是 可 行 的 
addLiveNode (eNodeWeight + remainingWeight[eNodeLevel]， 
eNodeLevel + 1, eNode, false); 


/ 取 下 一 个 下 -节点 ， 推 不 能 为 空 

heapNode nextENode = liveNodeMaxHeap.top(); 

liveNodeMaxHeap .pop (); 

eNodeLevel = nextENode.level; 

eNode = nextENode.liveNode; 

eNodeWeight = nextENode.upperWeight 

一 remainingWeight [eNodeLevel - 1]; 

} 


1// 沿 着 从 eNode 到 根 的 路 径 生 成 bestLoading[] 

for (int j = numberOfContainers; j > 07 j--) 

{ 
bestLoading[jj = (eNode->leftcChild) ? 1 : 0; 
eNode = eNode->parent; 

} 1 


return eNodeWeight; 


5. 关于 实现 的 说 明 

定义 maxWeightSoFar 为 当前 可 行 节点 的 最 大 重量 。 活 动 节点 的 优先 级 队列 可 能 
包含 若干 个 其 upperWeight 不 超过 maxWeightSoFar 的 节点 。 沿 着 这 些 节点 不 可 能 到 达 
最 优 叶 节点 。 这 些 节 点 占用 了 珍贵 的 队列 空间 ， 也 增加 了 插入 /删除 操作 的 时 间 。 我 
们 应 该 删除 这 些 节 点 。 一 种 删除 策略 是 ， 在 把 一 个 节点 插入 优先 级 队列 之 前 ， 检验 
是 否 有 upperWeight>maxWeightSoFar。 然 而 ， 由 于 maxWeightSoFar 在 算法 执行 过 
程 中 是 不 断 增 大 的 ， 所 以 目前 在 插入 时 经 过 检验 的 节点 ， 在 以 后 可 能 不 再 满足 条 件 
upperWeight>maxWeightSoFar。 一 个 更 积极 的 策略 是 ， 只 要 maxWeightSoFar 增值 ， 就 进 
行 检验 ， 把 upperWeight<maxWeightSoFar 的 节点 从 优先 级 队列 中 删除 。 这 种 策略 要 求 删除 
upperWeight 最 小 的 节点 。 因 此 ， 我 们 需要 一 种 优先 级 队列 ， 它 既 能 插入 和 删除 最 大 节点 ， 也 
能 删除 最 小 节点 。 这 种 优先 级 队列 称 作 双 端 优先 级 队列 (double-ended priority queue )。 关 于 
这 种 队列 的 数据 结构 ， 请 参看 本 书 网 站 。 
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21.2.2 0/1 背包 问题 


0/1 背包 问题 的 最 大 收益 分 支 定 界 算 法 可 以 用 程序 20-9 来 设计 ， 对 每 一 个 活动 节点 N， 
计算 收益 上 限 maxPossibleProfitInSubtree， 使 得 在 以 N 为 根 的 子 树 中 ， 任 一 节点 的 收益 值 都 
不 可 能 超过 maxPossibleProfitInSubtree。 

最 大 收益 分 支 定 界 算法 的 代码 与 程序 21-5 相似 。 我 们 使 用 活动 节点 大 根 堆 ， 然 后 按 需 
要 构造 解 空间 树 。 大 根 堆 的 元 素 类 型 是 heapNode， 它 具有 数据 成 员 upperProfit ( 子 树 中 任 
意 一 个 叶 节 点 的 收益 上 限 )、profit ( 该 节点 的 部 分 解 的 收益 )、weight ( 该 节点 的 部 分 解 的 重 
量 )、level (该 节点 在 解 空 间 树 的 层 )、liveNode (指向 解 空 间 树 中 相应 节点 的 指针 )。 节 点 按 
其 upperProfit 值 从 最 大 堆 中 取出 。 解 空间 树 中 的 节点 类 型 是 bbNode， 它 具有 数据 成 员 parent 
(指向 父 节 点 的 指针 ) 和 leftChild ( 当 且 仅 当 节点 是 其 父 节 点 的 左 孩 子 时 ， 值 为 true )。 

程序 21-6 假设 背包 装载 对 象 已 经 按 收益 密度 递增 顺序 排序 ， 使 用 的 是 程序 20-7 中 的 方 
法 。 函 数 addLiveNode 使 用 一 个 bbNode 类 型 的 节点 ， 把 新 的 活动 节点 插 人 到 解 空 间 树 ， 同 时 
使 用 一 个 heapNode 类 型 的 节点 ， 把 新 的 活动 节点 插入 大 根 堆 。 这 个 函数 与 程序 21-4 的 装载 
程序 很 类 似 ， 因 此 函数 代码 便 省 略 了 。 


程序 21-6 ”0/1 背包 问题 的 最 大 收益 分 支 定 界 法 


double maxProfitBBKnapsack () 
{1/ 用 最 大 收益 分 支 定 界 法 搜索 解 空间 树 
// 令 bestPackingSoFar[i] = 1， 当 且 仅 当 对 象 工 属于 最 优 装载 背包 
1/ 返回 最 优 装载 收益 
1/ 初始 化 层 1 中 的 始点 
bbNode* eNode = NULL; 
int eNodeLevel = 1; 
double maxProfitSoFar = 0.0; 
double maxPossibleProfitInSubtree = profitBound (1) ; 








// 搜索 子 空间 树 
while (eNodeLevel != numberOfObjects + 1) 
{// 不 在 叶 节 点 
// 检查 左 孩 子 节点 
double weightOfLeftChild = weightOfCurrentPacking 
+ weight[eNodeLevel]; 
if (weightOofLeftChild <= capacity) 
{/ 可 行 的 左 孩 子 节点 
if (profitFromCurrentPacking + profit[eNodeLevell] 
> maxProfitSoFar) 
maxProfitSoFar = profitFromCurrentPacking 
+ profit[eNodeLevel]; 
addLiveNode (maxPossibleProfitInSubtree， 
profitFromCurrentPacking + profitleNodeLevell], 
weightOfCurrentPacking + weight[eNodeLevell], 
eNodeLevel + 1, eNode, true); 
| 
maxPossibleProfitInSubtree = profitBound(eNodeLevel + 1); 


1/ 检查 右 孩 子 节点 
if (maxPossibleProfitInSubtree >= maxProfitSoFar) 
// 右 孩子 是 可 行 的 


addLiveNode (maxPossibleProfitInSubtree, 
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profitFromCurrentPacking, 
weightOfCurrentPacking, 
eNodeLevel + 1, eNode, false); 


1/ 取 下 一 个 EE- 节 点 ， 堆 不 为 空 

heapNode nextENode = liveNodeMaxHeap.top(); 
liveNodeMaxHeap.pop(); 

eNode = nextENode.liveNode; 

weightOfCurrentPacking = nextENode .weight; 
profitFromCurrentPacking = nextENode.profit; 
maxPossibleProfitinSubtree = nextENode.upperProtfit; 
eNodeLevel = nextENode,.,level; 


} 


// 沿 着 从 节点 eNode 到 根 的 路 径 构 造 bestPackingSoFar[] 

for (int j = numberOfObjects; j > 0; j--) 

lt 
bestPackingSoFar[j] = (eNode->leftChild) ? 1 : 0; 
eNode = eNode->parent; 

} 


return profitFromCurrentPacking; 


} 


函数 maxProfitBBKnapsack 用 最 大 收益 分 支 定 界 法 搜索 子 集 树 。while 循环 的 迭代 直到 一 
个 叶 革 点 成 为 E- 节 点 时 为 止 。 因 为 留 在 大 根 堆 中 的 节点 没有 一 个 的 收益 上 限 大 于 该 叶 节 点 的 
收益 ， 所 以 该 叶 节 点 便 对 应 一 个 最 优 解 ， 它 是 由 该 叶 节 点 至 根 的 路 径 确 定 的 。 

maxProfitKnapsack 中 的 while 循环 的 结构 与 程序 21-4 的 while 循环 很 类 似 。 首 先 检 验 E- 
节点 左 孩 子 的 可 行 性 。 若 它 是 可 行 的 ， 则 将 它 插 入 子 集 树 和 活动 节点 表 ( 即 大 根 堆 )。 仅 当 节 
点 右 孩 子 的 maxPossibleProfitInSubtree 值 预示 着 这 个 右 孩 子 可 能 带 给 我 们 一 个 最 优 解 时 ， 我 
们 才 将 它 加 入 子 集 树 和 活动 节点 表 中 。 


21.2.3 ”最 大 完备 子 图 


完备 子 图 问题 ( 见 20.2.3 节 ) 的 解 空 间 树 也 是 一 个 子 集 树 ， 因 此 与 解决 装 箱 问 题 和 背 
包 问 题 一 样 ， 我们 在 解决 完备 子 图 问题 时 ， 也 可 以 使 用 最 大 收益 分 支 定 界 法 。 解 空间 树 部 
分 中 的 节点 类 型 为 bbNode， 而 最 大 优先 队列 中 的 节点 类 型 是 heapNode。 这 一 次 ， 节 点 类 
型 heapNode 的 数据 成 员 有 cliqueSize ( 该 节点 所 对 应 的 完备 子 图 中 的 顶点 数目 )、upperSize 
(该 节点 子 树 中 叶 节 点 所 对 应 的 最 大 的 完备 子 图 的 大 小 )、level ( 节点 在 解 空 间 树 中 的 层 )、 
liveNode ( 解 空间 树 中 相应 节点 的 指针 )。upperSize 的 值 等 于 cliqueSize+n-level+1。 因 为 根据 
upperSize 和 cliqueSize， 或 upperSize 和 level， 可 以 求 出 level 或 cliqueSize， 所 以 可 以 去 掉 
cliqueSize 或 level 域 。 当 从 最 大 优先 级 队列 中 选取 元 素 时 ， 选 取 upperSize 最 大 的 元 素 。 在 实 
现代 码 中 ，heapNode 包含 了 所 有 三 个 域 : cliqueSize、upperSize 和 level。 这 样 一 来 ， 如 果 需 
要 改变 upperSize 的 内 容 ， 那 就 容易 了 。 

函数 addLiveNode 把 一 个 活动 节点 插入 正在 构建 的 子 集 树 和 大 根 堆 中 。 其 代码 与 装 箱 和 
背包 问题 中 的 对 应 函数 很 相似 ， 故 将 其 省 去 。 

程序 21-7 是 方法 maxProfitBBMaxClique。 它 是 类 adjacencyGraph 的 一 个 成 员 ， 对 解 空 
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间 子 集 树 实施 最 大 收益 分 支 定 界 搜索 。 树 的 根 是 初始 E- 节 点 。 这 个 节点 并 没有 在 所 构造 的 树 
中 明确 地 存储 。 对 于 这 个 节点 来 说 ， 其 sizeOfCliqueAtENode 值 (E- 节 点 对 应 的 完备 子 图 的 大 
小 ) 为 0， 因 为 还 没有 任何 顶点 加 和 人 到 完备 子 图 。E- 节 点 的 层 由 变量 eNodeLevel 指定 。 它 的 
初 值 为 1， 因为 初始 E- 节 点 是 子 集 树 的 根 。 

在 while 循环 中 ， 不 断 扩 展 E- 节 点 ， 直 到 一 个 叶 节 点 ( 即 一 个 n+1 层 的 节点 ) 变 成 
E- 节 点 。 对 于 一 个 时节 点 ，upperSize=sizeOfCliqueAtENode。 由 于 所 有 其 余 节点 的 upperSize 
值 都 小 于 等 于 当前 E- 节 点 的 upperSize 值 ， 所 以 ， 与 当前 E- 节 点 所 表示 的 完备 子 图 相 比 ， 它 
们 不 可 能 产生 更 大 的 完备 子 图 。 因 此 最 大 完备 子 图 已 经 找到 。 在 生成 子 集 树 中 ， 沿 着 已 成 为 
E- 节 点 的 叶 节 点 到 根 的 路 径 构 造 这 个 最 大 完备 子 图 。 

为 了 扩展 一 个 非 叶 节 点 的 E- 节 点 ， 首 先 检查 它 的 左 孩 子 。 如 果 左 孩子 所 对 应 的 顶点 v 与 
当前 E- 节 点 所 包含 的 每 一 个 顶点 之 间 都 有 一 条 边 ， 则 把 顶点 v 加 入 当前 的 完备 子 图 。 为 此 ， 我 
们 沿 着 从 E- 节 点 到 根 的 路 径 ， 确 定 其 中 包含 哪些 顶点 ， 而 且 证 实 每 一 个 被 包含 的 顶点 都 与 顶点 
v 有 边 相 连 。 如 果 左 孩子 是 可 行 的 ， 则 把 它 加 入 最 大 优先 级 队列 和 正在 构造 的 子 集 树 。 下 一 步 ， 
如 果 右 孩子 的 子 树 包 含 一 个 叶 节 点 ， 它 对 应 一 个 最 大 完备 子 图 ， 则 把 右 孩 子 也 加 入 进来 。 

由 于 每 个 图 都 有 一 个 最 大 完备 子 图 ， 所 以 在 从 大 根 堆 中 删除 节点 时 ， 不 需要 检验 堆 是 否 
为 空 。 仅 当 到 达 一 个 可 行 的 叶 节 点 时 ，while 循环 才 终 止 。 


程序 21-7 最 大 完备 子 图 问题 的 最 大 收益 分 支 定 界 算法 


int maxProfitBBMaxClique (int *maxCliqgue) 
{1/ 最 大 收益 分 支 定 界 法 寻找 最 大 子 图 
/maxCclique[i] 值 为 1， 当 生 仅 当 i 属于 最 大 完备 子 图 
/返回 最 大 完备 子 图 的 大 小 

1/ 初始 化 层 1 中 的 始点 

bbNode* eNode = NULL; 

int eNodeLevel = 1; 

int sizeOfCcliqueAtENode = 0; 

int sizeOfMaxCliqueSoFar = 0; 


// 搜索 子 集 空间 树 
while (eNodeLevel != n + 1) 
{// 当 不 在 叶 节 点 时 
/查看 顶点 eNodeLevel 是 否 与 当前 完备 子 图 的 所 有 顶点 相连 
bool connected = true; 
bbNode* currentNode = eNode; 
for (int j = eNodeLevel - 1; 3 > 0; 
currentNode = currentNode->parent,j--) 
if (currentNode->leftChild && !aleNodeLevel] [j]) 
{/ 顶点 j 了 属于 完备 子 图 ， 但 是 和 顶点 eNodeLevel 之 间 没 有 边 
connected = false; 
break; 


} 


if (connected) 
{1/ 左 孩 子 可 行 
if (sizeOfCliqueAtENode + 1 > sizeOfMaxCliqueSoFar) 
SizeOfMaxCliqueSoFar = sizeOfCliqueAtENode + 1; 
addLiveNode (sizeOfCliqueAtENode + n - eNodeLevel + 1, 
sizeOfCliqueAtENode + 1, eNodeLevel + 1, eNode, true); 


538 融 三 衣 分 “站 法 证 矿 方 法 


if (sizeOfCliqueAtENode + n - eNodeLevel >= sizeOfMaxCliqueSoFar) 
1/ 右 孩子 可 行 
addLiveNode (sizeOfCliqueAtENode + n - eNodeLevel, 
sizeOfCliqueAtENode, eNodeLevel + 1, eNode, false); 


1/ 取 下 一 个 -节点 ， 堆 不 为 空 
heapNode nextENode = liveNodeMaxHeap.top(); 
liveNodeMaxHeap .pop(); 
eNode = nextENode.liveNode; 
sizeOfcCcliqueAtENode = nextENode.cliqueSize; 
eNodeLevel = nextENode.level; 

} 


1// 沿 着 从 eNode 到 根 的 路 径 构 建 maxClidue[] 

faor (int 了 二 ny TT 0 j==) 

{ 
maxclique[j] = (eNode->leftchild) ?2 1 :; 0; 
eNode = eNode->parent; 

} 


return sizeOfMaxCliqueSoFar; 


21.2.4 ”旅行 商 问题 


旅行 商 问 题 的 介绍 见 20.2.4 节 。 它 的 解 空间 是 排列 树 。 如 在 子 集 树 中 进行 最 大 收益 和 最 
小 耗费 分 支 定 界 搜索 一 样 ， 这 里 也 有 两 种 求解 方法 。 第 一 种 只 使 用 一 个 优先 级 队列 ， 其 中 每 个 
元 素 都 包含 到 根 的 路 径 。 另 一 种 使 用 生成 的 部 分 解 空 间 树 和 一 个 活动 节点 的 优先 级 队列 。 这 个 
优先 级 队列 中 的 元 素 并 不 包含 到 达 根 的 路 径 。 本 节 只 实现 前 一 种 方法 ， 虽 然后 者 也 使 用 过 。 

因为 要 寻找 最 小 耗费 旅行 路 径 ， 所 以 使 用 最 小 耗费 分 支 定 界 法 。 实 现 方法 使 用 活动 
节点 的 最 小 优先 级 队列 。 队 列 中 每 个 节点 的 类 型 为 heapNode。 每 个 节点 具有 partialTour 
域 ( 从 1 到 nm 的 整数 排列 ， 其 中 partialTour[0]=1 ); sizeOfPartialTour 域 (一 个 整数 ， 使 得 
partialTour[0: sizeOfPartialTour] 成 为 从 排列 树 的 根 节点 到 当前 节点 的 路 径 所 定义 的 旅行 前 组 ， 
partialTour[sizeOfPartialTour+1:n-1] 为 旅行 中 还 要 访问 的 节点 ， 而 且 它 还 等 于 部 分 旅行 中 的 
边 数 ) ; costOfPartialTour 域 ( 从 解 空间 树 的 根 到 当前 节点 的 路 径 所 表示 的 旅行 前 缀 的 费用 ) ; 
lowerCost 域 ( 在 当前 节点 子 树 中 任意 叶 节 点 中 的 最 小 耗费 ) 和 minAdditionalCost 域 ( 始 于 顶 
点 partialTour[sizeOfPartialTour:n-1] 的 最 小 费用 的 出 边 的 费用 之 和 )。 根 据 lowerCost 值 实施 
小 根 堆 的 删除 操作 。 分 支 定 界 算法 的 代码 见 程序 21-8。 


程序 21-8 ”旅行 商 问题 的 最 小 费用 分 支 定 界 算法 
T leastCostBBSalesperson(int *bestTour) 
{1/ 最 小 费用 分 支 定 界 代码 ， 寻 找 最 短 旅行 
/bestTour [i] 是 最 短 旅行 中 第 i 个 顶点 
/返回 最 短 旅 行 的 费用 


/此 处 省 略 的 检验 图 是 否 为 加 权 图 的 代码 


minHeap<heapNode> liveNodeMinHeap; 
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1/costOfMinOutEdge[i] = 顶点 1 的 费用 最 小 的 出 边 

T *costOfMinOutEdge = new T [n+ 1]; 

T sumOfMinCostOutEdges = 0; 

£06r MLNt i Ir + = Ni 土 二 出) 

{1/ 计 算 costofMinOutEdge[i] 和 sumOfMinCostOutEdges 
T minCost = noEdge; 
for (int 可 LF 本 < MW jr 


if (a[i] [jj] != noEdge && (minCost == noEdge || minCost > ali][j])) 
mincost = al[lil] [3]; 
if (minCost == noEdge) return noEdge; 1/ 没有 路 径 
costoOfMinOutEdge[i] = minCost; 


sumOfMinCostOutEdges += minCost; 


1/ 初始 E- 节 点 是 树 根 
heapNode eNode (0, 0, sumOfMinCostOutEdges, 0, new int [nj]j)， 
for (int 1 研 0% 入 妥 mE t+) 


eNode .partialTour[ij =i+1; 
T costoOfBestTourSoFar = noEdge; 1/ 当前 没有 找到 旅行 
int *partialTour = eNode.partialTour; /记录 eNode .partialTour 
/搜索 排列 树 


while (eNode.sizeOfPartialTour <n 一 1) 
{/ 不 在 叶 节 点 
partialTour = eNode.partialTour; 
if (eNode.sizeOfPartialTour == n - 2) 
{W/ 叶 节 点 的 父 节点 
1/ 把 两 廊 相 加 得 到 一 个 旅行 


1/ 检查 是 否 为 当前 更 优 的 旅行 

if (alpartialTour[ln - 2]] [partialTour[n - 1]] != noEdge 
&& alpartialTour[n - 1]]I[1] != noEdge 
&& (costOfBestTourSoFar == noEdge || 


eNode .costOfPartialTour 
+ alpartialTourin - 2]]ipartialTour[n - 1]] 
+ a[lpartialTour[n - 1]][1i] 
< costOfBestTourSoFar)) 
{W 是 更 优 的 旅行 
costOfBestTourSoFar = eNode.costOfPartialTour 
+ alpartialTour[n - 2]] [partialTour[In -~- 1]] 
+ alpartialTour[n - 1]][1]; 
eNode.costOfPartialTour = costOfBestTourSoFar; 
eNode.lowerCost = costOfBestTourSoFar; 
eNode.sizeOfPartialTourt+t+; 
liveNodeMinHeap.push (eNode); 


} 


else 
{// 生成 子 节 点 
for (int i = eNode.sizeOfPartialTour + 1; i < ny i++) 
if (a[partialTour[eNode.sizeOfPartialTour]] 
[partialTour[i]] != noEdge) 


/ 可 行 的 子 节点 ,旅行 费用 下 限 
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T costOfPartialTour = eNode.costOfPartialTour 
+ alpartialTour[eNode.sizeOfPartialTour]] [partialTour[il]; 
T minAdditionalCost = eNode.minAdditionalCost 
- costOfMinoOutEdge[partialTour 
[eNode .sizeOfPartialTour]]; 
T leastCostPossible = costOfPartialTour 
+ minAdditionalCost; 
if (costOfBestTourSoFar == noEdge || 
leastCostPossible < costOfBestTourSoFar) 
{/ 子 树 可 能 有 更 优 的 叶 节 点 ， 把 根 放 入 小 根 推 
heapNode hNode (leastCostPossible, 
costOfPartialTour, 
minAdditionalCost, 
eNode.sizeOfPpartialTour + 1， 
new int [n]); 
下 站 到 ”| 仁 交 和 入 二 0 这 和 于 和 下 ) 
hNode .PartialTour [jl = partialTour[j]; 
hNode .partialTour[eNode.sizeOfPartialTour + 1】 = 
partialTour [il]; 
hNode .partialTour[i] = 
partialTourleNode.sizeOfPartialTour + 1]; 
liveNodeMinHeap.push (hNode); 


} 


作 取 下 一 个 EE- 节 点 

delete [] eNode.partialTour; 

if (liveNodeMinHeap.empty()) break; 
eNode = liveNodeMinHeap.top(); 
liveNodeMinHeap.pop(}); 


if (costOfBestTourSoFar == NoEdge) 
return NULL; /没有 路 径 


/把 最 优 旅 行 复制 到 数组 bestTour[1:nl 
£6F (TNE 4 DF Le Ni i 
bestTour[i + 1] = partialTour[i]; 


return costOfBestTourSoFar; 


程序 21-8 首先 创建 小 根 堆 ， 用 于 活动 节点 的 最 小 优先 级 队列 。 下 一 步 计 算 有 向 图 中 每 
个 顶点 费用 最 小 的 出 边 的 费用 。 如 果 某 个 顶点 没有 出 边 ， 则 有 向 图 就 没有 旅行 路 径 ， 搜 索 终 
止 。 如 果 每 个 顶点 都 有 出 边 ， 则 启动 最 小 耗费 分 支 定 界 搜索 。 以 根 的 孩子 ( 图 20-5 的 节点 
B ) 作为 第 一 个 E- 节 点 。 由 此 生成 的 旅行 路 径 前 缀 只 有 一 个 顶点 1。 因 此 sizeOfPartialTour=0， 
partialTour[0]=1，partialTour[1:n-1] 是 剩余 的 顶点 ( 即 顶 点 2,3…,n )。 旅 行路 径 前 绥 1 的 费用 


n 


为 0， 即 costOfPartialTour=0。 而 且 ，minAdditionalCost= 》 costOfMinOutEdge[i]。 初 始 时 ， 
i=1 
没有 找到 任何 旅行 路 径 ， 因 此 costOfBestTourSoFar 的 值 为 null。 


while 循环 不 断 地 扩展 E- 节 点 ， 直 至 到 达 一 个 叶 节 点 或 没有 E- 节 点 可 以 扩展 。 当 
sizeOfPartialTour=n-1 时 ， 到 达 一 个 叶 节 点 ， 旅 行 前 级 是 partialTour[0:n-1]， 这 个 前 级 中 包含 
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了 有 向 图 中 所 有 mn 个 顶点 。 因 此 sizeOfPartialTour=n-1 的 活动 节点 即 为 一 个 叶 节 点 。 由 于 算 
法 本 身 的 性 质 ， 叶 节点 的 costOfPartialTour 和 lowerCost 等 于 其 对 应 的 旅程 费用 。 由 于 所 有 
剩余 活动 节点 的 lowerCost 值 都 至 少 等 于 从 小 根 堆 中 取出 的 第 一 个 叶 节点 的 lowerCost 值 ， 所 
以 不 可 能 由 它们 得 到 更 优 的 叶 节 点 。 因 此 ,一旦 有 一 个 叶 节 点 成 为 E- 节 点 ， 搜 索 过 程 即 可 结 
束 。 如 果 在 到 达 叶 节点 之 前 ,已 经 没有 EE- 节 点 可 以 扩展 ， 那 说 明 图 中 没有 旅行 路 径 。 

while 循环 体 分 别 按 两 种 情况 处 理 。 一 种 是 处 理 sizeOfPartialTour=n-2 的 EE- 节点。 这 时 的 
E- 节 点 是 某 个 单独 叶 节 点 的 父 节 点 。 如 果 这 个 叶 节 点 定义 了 一 个 可 行 的 旅行 ， 并 且 此 旅行 费 
用 小 于 当前 最 优 旅 行 费用 ， 则 把 这 个 叶 节 点 插入 小 根 堆 。 否 则 这 个 叶 节 点 被 舍弃 ， 然 后 人 处理 
下 一 个 E- 节 点 

其 余 的 E- 节 点 都 放 在 while 循环 体 的 第 二 种 情况 中 处 理 。 首 先生 成 当前 E- 节 点 的 每 个 
孩子 节点 。 由 于 这 个 E- 节 点 代表 一 条 可 行路 径 partialTour[0: sizeOfPartialTour]， 所 以 当 且 仅 
当 (partialTour[s],partialTour[]) 是 有 向 图 的 一 条 边 ， 是 partialTour[i] 是 路 径 partialTour[sizeOf- 
PartialTour+1:n-1] 上 的 顶点 时 ， 它 的 子 节点 可 行 。 对 于 每 个 可 行 的 孩子 节点 ， 将 边 (partial- 
Tour[sizeOfPartialTour],partialTour[i]) 的 费用 加 到 eNode.costOfPartialTour 上 即 可 得 到 路 径 前 级 
(partialTour[0:sizeOfPartialTour],partialTour[i]) 的 耗费 costOfPartialTour。 由 于 每 个 包含 此 前 级 
的 旅行 都 包含 每 个 剩余 顶点 的 一 个 出 边 ， 所 以 任何 叶 节 点 的 费用 都 不 会 小 于 costOfPartialTour 
加 上 每 一 个 剩余 顶点 的 费用 最 小 的 出 边 的 费用 之 和 。 我 们 用 这 个 下 限 值 作 为 E- 节 点 的 子 节点 
的 lowerCost 值 。 若 新 孩子 的 lowerCost 值 小 于 当前 最 优 旅行 的 费用 ， 则 把 新 孩子 择 到 活动 节 
点 表 ( 即 小 根 堆 ) 中 。 

如 果 有 向 图 不 含 旅行 ， 程 序 21-8 返回 null ; 否则 ， 返 回 最 优 旅行 的 费用 。 而 最 优 旅 行 的 


21.2.5 电路 板 排列 


电路 板 排列 问题 ( 见 20.2.5 节 ) 的 解 空 间 是 一 棵 排列 树 。 我 们 对 这 棵 树 ， 可 以 实施 最 
小 耗费 分 支 定 界 搜索 ， 以 寻找 最 小 密度 的 电路 板 排列 。 我 们 使 用 一 个 最 小 优先 级 队列 ， 其 
中 元 素 表 示 活 动 节点 ， 类 型 为 HeapNode。HeapNode 类 型 的 对 象 包 含 的 数据 域 有 partial ( 电 
路 板 的 一 个 排列 ) ; sizeOfPartial ( 电路 板 partial[1:sizeOfPartial] 分 别 放 在 1 到 sizeOfPartial 
的 位 置 上 ); partialDensity ( 电路 板 排列 partial[l:sizeOfPartial] 的 密度 ， 其 中 包括 到 达 
partial[sizeOfPartial] 右边 的 连 线 ) ; boardsInpartialWithNet ( boardsInpartialWithNet[j] 是 排列 
partial[1:sizeOfPartial] 中 包含 网 组 j 的 电路 板 的 数目 )。 节 点 按 其 partialDensity 值 的 递增 顺序 
从 小 根 堆 中 删除 。 相 应 的 代码 见 程序 21-9。 

程序 21-9 首 先 把 E- 节 点 初始 化 为 排列 树 的 根 。 在 此 节点 中 没有 电路 板 。 因 此 
sizeOfPartial=0，partialDensity=0，boardsInpartialWithNet[i]=0 (1 < i < numberOfBoards ), 
partial[1 : numberOfBoards] 是 整数 1 到 numberOfBoards 的 任意 排列 。 数 组 boardsWithNet 初 
始 化 ，boardsWithNet[i] 的 值 为 包含 网 组 i 的 电路 板 数目 。 当 前 最 优 电路 板 排 列 存储 在 数组 
bestPermutationSoFar 中 ， 对 应 的 密度 存储 在 leastDensitySoFar 中 。do-while 循环 一 次 检查 一 


个 E- 节 点 。 在 每 次 迭代 结束 时 ， 从 活动 节点 的 小 根 堆 中 选 出 其 partialDensity 值 最 小 的 节点 作 
为 下 一 个 E- 节 点 。 如 果 这 个 E- 节 点 的 partialDensity = leastDensitySoFar， 则 任何 剩余 活动 节 


点 都 不 能 使 我 们 找到 密度 小 于 leastDensitySoFar 的 电路 板 排 列 ， 因 此 算法 终止 。 
do-while 循环 分 两 种 情况 处 理 E- 节 点 ， 第 一 种 情况 是 sizeOfpartial=numberOfBoards-1。 
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此 种 情况 下 ， 有 numberOfBoards-1 个 电路 板 已 经 就 位 ， 而 且 BE- 节点 是 解 空间 树 中 某 个 
叶 节 点 的 父 节 点 。 与 这 个 叶 节 点 对 应 的 排列 是 partial。 计 算 它 的 密度 ， 如 果 需 要 ， 更 新 
leastDensitySoFar 和 bestPermutationSoFar。 

在 第 二 种 情况 中 ，E- 节 点 有 两 个 或 更 多 的 子 节点 。 生 成 每 一 个 子 节点 N， 计 算 与 该 
节点 对 应 的 部 分 排列 (partial[1:sizeOfpartial+1]) 的 密度 N.partialDensity。 只 有 N.partial- 
Density<leastDensitySoFar， 才 把 N 放 入 最 小 优先 级 队列 中 。 注 意 ， 当 N.partialDensity 二 
leastDensitySoFar 时 ， 子 树 中 的 所 有 叶 节 点 对 应 的 密度 都 三 leastDensitySoFar， 不 会 有 优 于 
bestPermutationSoFar 的 排列 。 


程序 21-9 电路 板 排列 问题 的 最 小 耗费 分 支 定 界 算法 


int leastCostBBBoards (int **board, int numberOfBoards, int numberOfNets, 
int *bestPermutation) 

{1/ 最 小 费用 分 支 定 界 代码 

/返回 最 优 排列 密度 


minHeap<heapNode> liveNodeMinHeap; 


1/ 初始 化 第 一 个 EE- 节 点 (PartialDensity， 
l/boardsInpartialWithNet, sizeOfPartial, partial) 
heapNode eNode (0, new int [numberOfNets + 1], 

0, new int [numberOfBoards + 1]); 


// 令 eNode.boardsInPartialWithNet[i] = partial[1:s] 中 含有 网 组 i 的 电路 板 个 数 
// 令 eNode.partial[i] = 主 ， 初 始 排 列 

1/ 令 eNode.boardsWithNet[i] = 带 有 网 组 i 的 电路 板 个 数 

int *boardsWithNet = new int [numberOfNets + 1]; 

fill (boardsWithNet + 1, boardsWithNet + numberOfNets + 1, 0); 


for (int i = 1; i <= numberOfBoards i++) 
eNode .partial[i] = i; 
eNode.boardsInPartialWithNet[i] = 0; 


for (int jj = 1; jj <= numberOfNets; j++) 
boardsWithNet[j] += board[i] [j]; 


int leastDensitySoFar = numberOfNets + 1; 
int *bestPermutationSoFar = NULL; 


do 
{// 扩展 EE- 节 点 
if (eNode.sizeOfPartial == numberOfBoards - 1) 
{W/ 仅 有 一 个 子 节点 
int localDensityAtLastBoard = 0; 
for (int j] = 1; j <= numberOfNets; j++) 
localDensityAtLastBoard += 
board[eNode.partial [numberOfBoards]][j]; 
if (localDensityAtLastBoard < leastDensitySoFar) 
{// 更 优 的 排列 
bestPermutationSoFar = eNode.partial; 
eNode .partial = NULL; 
leastDensitySoFar = max(localDensityAtLastBoard, 
eNode.partialDensity); 
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} 
else 
{W 生成 -节点 的 子 节点 
for (int i = eNode.sizeOfPartial + 1; i <= numberOfBoards; i+t++) 
{ 
heapNode hNode (0, new int [numberOfNets + 1], 
0, new int [numberOfBoards + 1]); 
for (int jj = 1; j <= numberOfNets; j++) 
1/ 计算 新 电路 板 中 的 网 组 
hNode.boardsInPartialWithNet[j] = 
eNode .boardsIinPpartialWithNet{[j] 
+ boardleNode.partial[il]][j]; 


int localDensityAtNewBoard = 0，; 
for (int JJ = 1; j <= numberOfNets; j++) 
if (hNode.boardsInPartialWithNet[j] > 0 &E& 
boardsWithNet[j] != hNode.boardsInPartialWithNet[j]) 
localDensityAtNewBoard++; 


hNode.partialDensity = max(localDensityAtNewBoard, 
eNode .partialDensity); 
if (hNode.partialDensity < leastDensitySoFar) 
{VW 可 能 导致 更 优 的 叶 节 点 
hNode.sizeOfPartial = eNode.sizeOfPartial + 1; 
for (int j = 1; 1 <= numberOfBoardss? j++) 
hNode .partial[j] = eNode.partial[j]; 
hNode .partial [hNode.sizeOfPartial] = eNode.partiall[i]; 
hNode.partiall[i] = eNode.partial[hNode.sizeOfpartiall]; 
liveNodeMinHeap.push (hNode); 


/下 一 个 一 -节点 

delete [] eNode.partial; 

delete [] eNode.boardsInPartialWithNet,; 
if (liveNodeMinHeap.empty()) break; 


eNode = liveNodeMinHeap.top(); 
liveNodeMinHeap .pop(); 
} while (eNode.partialDensity < leastDensitySoFar); 


for (int i = 1; i <= numberOfBoards; .i++) 
bestPermutation[i] = bestPermutationSoFar[i]; 
return leastDensitySoFar; 





练习 


3. 在 程序 21-4 中 ， 定 义 一 个 maxWeightSoFar 来 记录 目前 生成 的 可 行 节点 所 对 应 的 最 大 重量 。 
修改 程序 21-4， 使 得 当 且 仅 当 一 个 活动 节点 的 upperWeight 大 于 或 等 于 maxWeightSoFar 时 ， 
将 它 加 入 子 集 树 和 大 根 堆 中 。 此 外 ， 还 必须 增加 初始 化 和 更 新 maxWeightSoFar 的 代码 。 

4. 编写 一 个 最 大 收益 分 支 定 界 代码 求解 货 箱 装载 问题 ， 只 使 用 一 个 最 大 优先 级 队列 。 即 不 要 
像 程序 21-4 那样 ， 使 用 部 分 解 空间 树 。 每 个 优先 级 队列 的 节点 都 包含 通 向 根 节点 的 路 径 。 
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5. 编写 最 大 收益 分 支 定 界 代 码 ,， 求解 0/1 背包 问题 ， 只 使 用 一 个 最 大 优先 级 队列 。 即 不 必 保 
存 部 分 解 空 间 树 。 每 个 优先 级 队列 的 节点 都 包含 通 向 根 节点 的 路 径 。 

6. 1 ) 在 程序 21-7 中 , 若 右 孩子 的 upperSize 值 大 于 等 于 bestm， 则 加 入 大 根 堆 。 如 果 条 件 改 
为 upperSize 值 仅 大 于 sizeOfMaxCliqueSoFar， 那 么 程序 是 否 还 正确 ?为 什么 ? 

2 ) 程序 是 否 将 其 upperSize 三 sizeOfMaxCliqueSoFar 的 左 孩 子 加 入 大 根 堆 ? 
3 ) 修改 程序 ， 使 得 只 将 其 upperSize>sizeOfMaxCliqueSoFar 的 节点 加 入 大 根 堆 和 正在 生成 
的 解 空 间 子 树 。 

7. 考察 最 大 完备 子 图 问题 的 解 空间 树 。 对 于 子 树 的 任意 i 层 的 节点 X， 令 minDegree(x) 为 x 
所 包含 的 顶点 的 度 的 最 小 值 。 

1 ) 证 明 以 x 为 根 的 子 树 中 ， 任 何 叶 节 点 都 不 可 能 表示 这 样 的 一 个 完备 子 图 ， 其 大 小 超过 
x.upperSize=min {x.sizeOfCliqueAtENode+n-i+l,minDegree(x)+1}, 

2 ) 使 用 以 上 x.upperSize 的 定义 重 写 maxProfitBBMaxClique。 

3 ) 在 运行 时 间 和 解 空间 树 的 节点 个 数 方面 ， 比 较 maxProfitBBMaxClique 的 两 个 版 本 。 

8. 编写 最 大 收益 分 支 定 界 代码 ,求解 最 大 完备 子 图 问题 ， 只 使 用 最 大 优先 级 队列 。 即 不 用 保 
存 一 个 部 分 解 空间 树 。 最 大 优先 级 队列 的 每 一 个 节点 都 包含 通 向 根 的 路 径 。 

9. 修改 程序 21-8， 使 得 其 sizeOfPartialTour=n-2 的 节点 不 进入 优先 级 队列 。 并 且 ， 把 当前 最 优 排 
列 存 储 在 数组 bestPermutationSoFar 中 。 当 下 一 个 E- 节 点 的 lowerCost = costOfBestTourSoFar 
时 ， 算 法 终止 。 

10. 编写 程序 21-8 的 另 一 个 版 本 ， 它 使 用 父 节 点 指针 来 直接 保存 由 算法 检查 的 部 分 解 空 间 
树 ( 像 程 序 21-6 那 样 )， 优 先 级 队列 节点 仅 包含 数据 域 lowerCost、costOfPartialTour、 
minAdditionalCost 和 liveNode ( 解 空间 树 中 对 应 节点 的 指针 )。 

11. 写 出 FIFO 分 支 定 界 代码 ,求解 电路 板 排 列 问题 。 必 须 输 出 最 优 电路 板 排列 及 其 密度 。 使 
用 合理 的 数据 来 测试 代码 的 正确 性 。 

12. 编写 FIFO 分 支 定 界 算法 ， 寻 找 一 种 电路 板 排列 ， 使 得 最 长 网 组 的 长 度 最 小 ( 参见 第 20 
章 练习 17 )。 

13. 使 用 最 小 耗费 分 支 定 界 法 来 完成 练习 12。 

14. 编写 最 小 耗费 分 支 定 界 算法 ,求解 第 20 章 练习 18 的 顶点 覆盖 问题 。 

15. 编写 最 大 收益 分 支 定 界 算法 ， 求 解 第 20 章 练习 19 的 简易 最 大 切割 问题 ， 

16. 编写 最 小 耗费 分 支 定 界 算 法 ， 求 解 第 20 章 练习 20 的 机 器 设计 问题 。 

17. 编写 最 小 耗费 分 支 定 界 算法 ， 求 解 第 20 章 练习 21 的 网 络 设计 问题 。 

18. 编写 FIFO 分 支 定 界 算法 ,求解 第 20 章 练习 22 的 皇后 放置 问题 。 

19. 用 FIFO 分 支 定 界 完成 第 20 章 练习 23。 

20. 用 FIFO 分 支 定 界 完成 第 20 章 练习 24。 

21. 用 FIFO 分 支 定 界 完成 第 20 章 练习 25。 

22. 用 最 小 耗费 分 支 定 界 完成 第 20 章 练习 23。 

23. 用 最 小 耗费 分 支 定 界 完成 第 20 章 练习 24。 

24. 用 最 小 耗费 分 支 定 界 完成 第 20 章 练 习 25。 

25. 用 任意 分 支 定 界 方法 完成 第 20 章 练习 25。 为 此 ， 需 要 使 用 函数 来 增加 活动 节点 ， 并 且 选 
择 下 一 个 E- 节 点 作为 函数 的 参数 。 


